证券分析师 证券研究报告|行业周报 计算机 2024年1月8日 计算机 微软将AI按钮放置在windows键盘上,AI能力将打造PC端新竞争力 优于大市(维持) 钱劲宇 资格编号:S0120523090002 投资要点: 邮箱:qianjy5@tebon.com.cn 市场表现 55% 44% 33% 22% 11% 0% -11% -22% 计算机沪深300 本周AI新闻速递。1)微软在ios平台上架了Copilot,允许用户访问OpenAI的GPT-4,并且完全免费;2)Writerbuddy发布全球热门AI工具报告:ChatGPT创造146亿访问量,排名第一;3)OpenAI联创GregBrockman在X平台上 预测,2024年,AI的能力、安全性、潜在影响的积极性上,都会是突破性的一年; 4)Midjourney公司计划在未来几个月推出“文本转视频”模型,同时V6更新 2022-122023-042023-08 相关研究 1.《计算机行业2024年度投资策略》,2023.12.13 2.《“滴水OS”正式发布,引领未来智能出行新篇章》,2023.12.11 3.《谷歌大模型Gemini正式发布,全球AI赛道或迎加速催化》,2023.12.10 4.《新晨科技(300542.SZ):发布向特定对象发行A股股票定增预案,有望增强主营业务,实现可持续发展》,2023.12.7 5.《Pika1.0发布,多模态AIGC应用有望加速落地》,2023.12.3 提升画质和用户体验;5)腾讯推出的M2UGen是一款多模态音乐生成框架,结合音乐和多模态任务,支持从文字、图像、视频生成音乐,并具备强大的编辑功能;6)三星正式宣布Galaxy全球新品发布会将于北京时间1月18日凌晨2点举行,新一代Galaxy旗舰新品也即将问世,聚焦GalaxyAI;7)微软键盘新增AI按钮在windows键盘上。微软将在Windows键盘上增加一个按钮,以激活其AICopilot服务,首批配备新按键的设备将于本月上市。Copilot键将位于空格键的右侧,这是微软自1994年增加Windows/Start键以来首次改变Windows键盘布局;8)1月5日,OpenAI向GPT开发者推送邮件计划下周推出GPT商店。 本周AI科研前沿。1)OpenVoice:多功能即时语音克隆;2)Paint3D:根据文本或图像输入,为无纹理的3D模型进行纹理绘制。 风险提示:AI技术落地不及预期、市场需求不及预期、全球供应链风险加剧 请务必阅读正文之后的信息披露和法律声明 内容目录 1.本周AI新闻速递3 1.1.AI应用3 1.2.AI硬件3 2.本周AI科研前沿3 2.1.OpenVoice:多功能即时语音克隆3 2.2.Paint3D:根据文本或图像输入,为无纹理的3D模型进行纹理绘制4 3.风险提示5 1.本周AI新闻速递 1.1.AI应用 (1)微软在ios平台上架了Copilot,允许用户访问OpenAI的GPT-4,并且完全免费(AI新智界)。 (2)Writerbuddy发布全球热门AI工具报告:ChatGPT创造146亿访问量,排名第一(财经头条)。 (3)OpenAI联创GregBrockman在X平台上预测,2024年,AI的能力、安全性、潜在影响的积极性上,都会是突破性的一年(“X”平台)。 (4)Midjourney公司计划在未来几个月推出“文本转视频”模型,同时V6 更新提升画质和用户体验(AIcoin)。 (5)腾讯推出的M2UGen是一款多模态音乐生成框架,结合音乐和多模态任务,支持从文字、图像、视频生成音乐,并具备强大的编辑功能。(官方演示视频地址:https://crypto-code.github.io/M2UGen-Demo/)。 (6)1月5日,OpenAI向GPT开发者推送邮件计划下周推出GPT商店。 1.2.AI硬件 (1)三星正式宣布Galaxy全球新品发布会将于北京时间1月18日凌晨2 点举行,新一代Galaxy旗舰新品也即将问世,聚焦GalaxyAI(搜狐)。 (2)微软新增AI按钮在windows键盘上。微软将在Windows键盘上增加一个按钮,以激活其AICopilot服务,首批配备新按键的设备将于本月上市。Copilot键将位于空格键的右侧,这是微软自1994年增加Windows/Start键以来首次改变Windows键盘布局(新浪财经)。 2.本周AI科研前沿 2.1.OpenVoice:多功能即时语音克隆 OpenVoice是一种多功能的即时语音克隆方法,只需要参考说话者的一个简短的音频剪辑即可复制他们的声音并生成多种语言的语音。除了复制参考说话者的音色之外,OpenVoice还可以对语音风格进行精细控制,包括情感、口音、节奏、停顿和语调。OpenVoice还可以针对海量说话人训练集中未包含的语言实现零样本跨语言语音克隆。OpenVoice的计算效率也很高,其成本比性能较差的市场上的商用API低数十倍。 自2023年5月以来,OpenVoice一直为myshell.ai提供即时语音克隆功能。截至2023年11月,该语音克隆模型已被全球用户使用了数千万次,并见证了该平台用户的高速增长。 OpenVoice的优势有以下三个方面: (1)准确的音色控制,OpenVoice可以准确克隆参考音色并生成多种语言和口音的语音。 (2)灵活的音色控制,OpenVoice可以对语音风格(例如情感和口音)以及其他风格参数(包括节奏、停顿和语调)进行精细控制。 (3)零样本跨语言语音克隆,生成语音的语言和参考语音的语言都不需要出现在大规模说话人多语言训练数据集中。 如图1,研究人员使用一个基本的说话者模型来控制风格和语言,并使用一个转换器来体现参考说话者的音色到语音中。 图1:OpenVoice模型架构 资料来源:OpenVoice,德邦研究所 OpenVoice可以对语音风格(例如情感和口音)以及其他风格参数(包括节奏、停顿和语调)进行精细控制。在这里,官网演示了对生成声音的情感和口音的控制。 图2:OpenVoice展示界面 资料来源:OpenVoice,德邦研究所 这项研究主要是解决除了克隆音色外,能够灵活地控制其他重要的风格参数,如情感、重音、节奏、停顿和语调,这些特性对于生成上下文中的自然语音和对话至关重要,而不是单调地叙述输入的文本。以前的方法只能从参考扬声器中克隆出单调的音调、音色和风格,但不支持风格调整。 2.2.Paint3D:根据文本或图像输入,为无纹理的3D模型进行纹理绘制 Paint3D是一种新颖的从粗到细的生成框架,能够为基于文本或图像输入的无纹理3D网格生成高分辨率、无光照且多样化的2KUV纹理图。 关键问题是在不嵌入照明信息的情况下生成高质量纹理,这允许在现代图形管道中重新编辑纹理。为了实现这一目标,研究人员首先利用预先训练的深度感知2D扩散模型来生成视图条件图像并执行多视图纹理融合,从而生成初始粗糙纹理图。然而,由于2D模型无法完全表示3D形状并不能使用照明效果,因此粗糙纹理贴图会表现出不完整的区域和照明伪影。为了解决这个问题,研究人员训练了单独的UVInpainting和UVHD扩散模型,专门用于不完整区域的形状感知细化和照明伪影的去除。通过这种从粗到细的过程,Paint3D可以生成高质量的2KUV纹理,在无光照的情况下保持语义一致性,从而推进3D对象纹理化。 图3:Paint3D框架展示 资料来源:XianfangZeng1*、XinChen1*、ZhongqiQi1*、WenLiu1、ZiboZhao1,3、ZhibinWang1、BINFU1、YongLiu2、GangYu1†、1TencentPCG、2ZhejiangUniversity、3ShanghaiTechUniversity《Paint3D:PaintAnything3DwithLighting-LessTextureDiffusionModels》,德邦研究所 3.风险提示 AI技术落地不及预期、市场需求不及预期、全球供应链风险加剧。 信息披露 分析师与研究助理简介 钱劲宇:德邦证券计算机行业首席分析师,哥伦比亚硕士,曾就职于华福证券、国泰君安,对AI、网安、云计算等有深度的研究。 分析师声明 本人具有中国证券业协会授予的证券投资咨询执业资格,以勤勉的职业态度,独立、客观地出具本报告。本报告所采用的数据和信息均来自市场公开信息,本人不保证该等信息的准确性或完整性。分析逻辑基于作者的职业理解,清晰准确地反映了作者的研究观点,结论不受任何第三方的授意或影响,特此声明。 投资评级说明 1.投资评级的比较和评级标准:以报告发布后的6个月内的市场表现为比较标准,报告发布日后6个月内的公司股价(或行业指数)的涨跌幅相对同期市场基准指数的涨 类别 评级 说明 股票投资评级 买入 相对强于市场表现20%以上; 增持 相对强于市场表现5%~20%; 中性 相对市场表现在-5%~+5%之间波动; 减持 相对弱于市场表现5%以下。 跌幅; 优于大市 预期行业整体回报高于基准指数整体水平10%以上; 2.市场基准指数的比较标准:A股市场以上证综指或深证成指为基准;香港市场以恒生指数为基准;美国市场以标普500或纳斯达克综合指数为基准。 行业投资评级 中性 预期行业整体回报介于基准指数整体水平-10%与10%之间; 弱于大市 预期行业整体回报低于基准指数整体水平10%以下。 法律声明 本报告仅供德邦证券股份有限公司(以下简称“本公司”)的客户使用。本公司不会因接收人收到本报告而视其为客户。在任何情况下,本报告中的信息或所表述的意见并不构成对任何人的投资建议。在任何情况下,本公司不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任。 本报告所载的资料、意见及推测仅反映本公司于发布本报告当日的判断,本报告所指的证券或投资标的的价格、价值及投资收入可能会波动。在不同时期,本公司可发出与本报告所载资料、意见及推测不一致的报告。 市场有风险,投资需谨慎。本报告所载的信息、材料及结论只提供特定客户作参考,不构成投资建议,也没有考虑到个别客户特殊的投资目标、财务状况或需要。客户应考虑本报告中的任何意见或建议是否符合其特定状况。在法律许可的情况下,德邦证券及其所属关联机构可能会持有报告中提到的公司所发行的证券并进行交易,还可能为这些公司提供投资银行服务或其他服务。 本报告仅向特定客户传送,未经德邦证券研究所书面授权,本研究报告的任何部分均不得以任何方式制作任何形式的拷贝、复印件或复制品,或再次分发给任何其他人,或以任何侵犯本公司版权的其他方式使用。所有本报告中使用的商标、服务标记及标记均为本公司的商标、服务标记及标记。如欲引用或转载本文内容,务必联络德邦证券研究所并获得许可,并需注明出处为德邦证券研究所,且不得对本文进行有悖原意的引用和删改。 根据中国证监会核发的经营证券业务许可,德邦证券股份有限公司的经营范围包括证券投资咨询业务。