您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[财通证券]:计算机行业投资策略周报:模型成本持续降低,大规模商业变现渐行渐近 - 发现报告
当前位置:首页/行业研究/报告详情/

计算机行业投资策略周报:模型成本持续降低,大规模商业变现渐行渐近

信息技术2023-06-18杨烨、罗云扬财通证券墨***
计算机行业投资策略周报:模型成本持续降低,大规模商业变现渐行渐近

新一轮行情开启。本周计算机指数上涨6.06%,跑赢沪深300指数2.76pct,在31个申万一级行业中涨幅排名第4,年初至今计算机已有37.49%的涨幅。 本周计算机板块表现符合我们上周《AI带领计算机进入强比较优势阶段》所述观点,板块将迎来新一轮行情。 大模型垂直应用百花齐放,API降价有望加速商业变现。(1)技术迭代加速,API价格大幅度降低利好大模型普及。OpenAI宣布对ChatGPT的GPT- 4、GPT-3.5系列模型进行更新,帮助企业、开发人员节省成本,增强开发体验,从而扩大ChatGPT的市场影响力,打造更广泛的用户群体。(2)微软将类ChatGPT功能的Copilot集成于ERP产品矩阵,成为企业管理的“对话助手”,生成式AI正在重塑ERP的使用方式,Copilot能快速提供可视化解决方案。(3)Meta发布首个成功实现任务泛化的多功能模型Voicebox,语音生成式AI实现新突破,Voicebox可以合成六种语言的语音,还可以执行噪声去除、内容编辑、风格转换和多样化样本生成。(4)“视频界的Midjourney”Gen2免费开放试用,利用文本描述生成视频,助力内容创作者生产力飞跃提升。 多模态趋势带动算力需求持续旺盛,AMD新品入局有望加速算力迭代。大模型多模态发展大势所趋,诸如将音像视频数据转化(预训练)、描述视频内容(推理生成)等过程亦需要消耗大量算力,随着大模型向多模态的不断演化,算力需求旺盛。2023年6月,AMD发布MI300X,我们认为,行业内有除英伟达以外的强劲入局者,有望大幅加快相关厂商技术迭代,进而带动AI产业从算力、模型、应用的全面加速发展。 汽车NOA元年,各大车厂驾驶AI齐发力。车厂驾驶AI加速发力。今年小鹏、理想、华为等纷纷加速NOA(领航辅助驾驶)的进展,小鹏城市NGP北京首开,华为ADS2.0降低成本加快领航辅助驾驶落地,理想实现NOA早鸟推送并推出MindGPT升级理想同学,此外奔驰宣布其车载语言助手接入ChatGPT。今年以来车厂主要在城市NOA中加速发力,以华为为代表的智驾方案开始向强感知强算法倾斜,此外车厂积极接入GPT强化自身座舱语音系统,提升车主体验。我们认为,今年或是NOA元年,车厂驾驶AI将伴随多模态大模型的浪潮加速发力。 投资建议:见正文。 风险提示:AI技术迭代不及预期的风险,商业化落地不及预期的风险,政策支持不及预期风险,全球宏观经济风险。 1本周回顾:新一轮行情开启 新一轮行情开启。本周计算机指数上涨6.06%,跑赢沪深300指数2.76pct,在31个申万一级行业中涨幅排名第4,年初至今计算机已有37.49%的涨幅。本周计算机板块表现符合我们上周《AI带领计算机进入强比较优势阶段》所述观点,板块将迎来新一轮行情。从当前时点看好计算机板块主要有三个出发点:(1)基本面提供确定性:对于具有相对稀缺的卡位的公司,以AI作为代表的技术打开长期EPS的展望,未来长期基本面兑现预期加强,将冲淡短期受宏观因素影响的EPS增长偏弱的事实。(2)流动性带来可能性:降息将推动无风险利率下行,由于成长性板块对无风险利率的边际敏感度较高,将提振计算机板块中期估值水平。(3)政策力度决定β强度:不仅是信创政策以及数据要素相关政策落地预期,各地支持AI发展政策接连出台,反映政府对底层技术革新的重视,随着对AI变革的共识的进一步明晰,后续β有望持续走强。 图1.计算机板块相对各指数涨跌幅统计(2023.6.12-2023.6.16,单位:%) 图2.本周各行业涨跌幅统计(2023.6.12-2023.6.16) 2大模型技术持续赋能垂直领域应用 2.1GPT模型更新,大幅度降低API价格,应用加速推广 技术迭代加速,API价格大幅度降低利好大模型普及。6月14日,OpenAI宣布对ChatGPT的GPT-4、GPT-3.5系列模型进行更新,帮助企业、开发人员节省成本,增强开发体验。随着全球各大行业开始将类ChatGPT功能集成在产品中,OpenAI希望帮助企业进一步降低应用成本,从而扩大ChatGPT的市场影响力,打造更广泛的用户群体。 text-embedding-ada-002是最受欢迎的嵌入模型之一。OpenAI将成本降低75%,每1K token 0.0001美元,帮助企业、开发者进一步节省开发成本。 GPT-3.5-turbo是OpenAI最受欢迎的聊天模型,为数百万用户提供ChatGPT服务。OpenAI将输入成本降低了25%,开发人员能以每1K输入token 0.0015美元和每1K输出token 0.002美元的价格使用该模型。 OpenAI推出了GPT4-16k平替版——GPT-3.5-turbo-16k,GPT-3.5-turbo-16k能够实现16000 tokens的上下文长度,相当于普通版GPT-3.5-turbo的4倍,价格为每输入1000 tokens 0.003美元,相当于降价95%。 OpenAI首席执行官Sam Altman在新加坡管理大学演讲时表示,OpenAI每三个月左右就能将推理成本降低90%,未来将继续大幅削减成本。大模型持续降本,呈现出类似集成电路“摩尔定律”的规律,随着算法与算力技术迭代,模型应用成本有望呈指数级下降,AI应用普及度将快速提升。 图3.GPT-4与ChatGPT的使用价格 2.2微软将类ChatGPT功能的Copilot集成于ERP产品矩阵,成为企业管理的“对话助手” 生成式AI正在重塑ERP的使用方式,通过文本问答就能快速实现各种功能,Copilot能快速提供可视化解决方案。微软在将Copilot功能集成在Microsoft Dynamics 365中,成为全球第一家在ERP、CRM中使用类ChatGPT的企业后,继续扩大了Copilot在ERP产品中的赋能范围,进一步帮助企业实现降本增效。 微软表示,为客户提供生成式AI服务时,将严格遵守微软的AI原则以及数十年来对AI、基础和隐私保护机器学习的研究。严格保护用户的数据隐私、数据安全等,提供负责任、透明、安全可靠、公平等AI服务。绝对不会使用,用户数据来训练大语言模型。Copilot为ERP赋能体现为以下3个方面: 帮助项目经理加速项目开发:借助Copilot,项目经理只需使用自然语言描述项目的详细信息,可以在几分钟内创建新的项目计划,支持对项目的自定义修改,Copilot还可以识别项目潜在的风险并给出优化建议,大幅度降低项目状态报告、任务规划和风险评估上的工作时间。 帮助财务、采购人员提升工作效率:Dynamics 365 Supply Chain Management中的Copilot功能,可对大批采购订单进行智能审查、分类、更改和查询等,Dynamics 365 Finance中的Copilot,可以快速访问信用和付款历史记录。 Copilot还能综合评估大量采购订单中潜在的危险以及优化建议,也可以将相关信息引入到微软的Outlook和Teams协作平台中。 提升ERP数据利用率:ERP是现代企业的中枢神经系统,集合了从财务、人力资源、采购、资源配置和供应链等核心职能部门的大量数据。员工通过集成了Copilot的Microsoft Power BI和Excel,可以快速获取ERP可视化数据见解。 图4.微软ERP产品增加Copilot功能 2.3Meta发布首个成功实现任务泛化的多功能模型Voicebox,语音生成式AI实现新突破 Voicebox是首个没有经过专门针对语音生成的训练,却可以泛化到语音生成任务的模型。Voicebox可以合成英语、法语、德语、西班牙语、波兰语、葡萄牙语六种语言的语音,还可以执行噪声去除、内容编辑、风格转换和多样化样本生成。 在Voicebox出现之前,训练语音生成AI需要使用精心准备的训练数据,而Voicebox仅需要从原始音频和随附的转录文本中学习,并且Voicebox可以修改给定样本的任何部分,该模型基于一种称为流匹配(Flow Matching)的方法,该方法已被证明可以改进扩散模型。在生成效果方面,Voicebox错词率和音频相似度两个指标明显优于当前英文语音生成SOTA模型VALL-E,并且速度快了20倍。同样,在跨语言风格迁移任务上,Voicebox表现优于YourTTS。 图5.Voicebox与其他模型在错词率方面的对比 图6.Voicebox与其他模型在音频相似度方面的对比 Voicebox可以执行多种不同任务,包括: 基于语境的文本转语音合成:仅需长度2秒的输入音频样本,Voicebox就能匹配样本的音频风格并将其用于文本转语音生成。 跨语言风格迁移:给定一段语音样本和对应的文本片段,Voicebox能以该语言读出该文本。 语音降噪和编辑:Voicebox基于上下文学习能力可以在音频录音中生成无缝衔接的片段。它可以重新合成音频中出现了被噪声污染的片段,无需重新录音就能替换原音频中说错的词句。 多样化的语音采样:Voicebox学习了多样化的野外数据,可以生成就像在现实世界中说话的声音,支持六种语言。这种能力未来可用于合成数据、训练语音助理模型等。 2.4“视频界的Midjourney”Gen2利用文本描述生成视频,创作生产力飞跃提升 “视频界的Midjourney”为视频创作者打开新应用空间。Gen2由Stable Diffusion和《瞬息全宇宙》背后技术公司Runway出品,是一个text to video的AI视频编辑工具,于Gen2于今年3月20日正式发布,6月12日开放用户免费使用。Runway的第一个人工智能软件Gen1能够使用现有视频的数据制作新视频,新的Gen2软件可以完全从文本描述中创建视频,这是该技术的一大飞跃。当前用户注册后可免费试用105秒,之后可选择标准版或者进阶版,包括文本+参考图像生视频、静态图片转视频、视频风格迁移等等,为内容创作者打开新的应用空间。 图7.利用Gen2可以使用文本生成短视频 图8.Gen2的付费模式 3AMD入局算力竞争,多模态大模型演化进一步催生算力需求 AMD发布MI300X,算力芯片竞争加剧有望为AI行业整体发展提速。AMD于2023年6月发布MI300系列算力芯片,主要为AI大模型打造,采用CDNA 3 GPU架构和24个Zen 4 CPU内核,配置128GB的HBM3内存。相比前代MI250,MI300的性能提高八倍,效率提高五倍。我们认为,AI算法效果提升以及应用场景落地,均离不开更高性能、更低成本的基础算力芯片升级。行业内有除英伟达以外的强劲入局者,有望大幅加快相关厂商技术迭代,进而带动AI产业从算力、模型、应用的全面加速发展。 图9.AMD与英伟达算力芯片性能 大模型向多模态演化,算力需求有望进一步提升。当前大模型主要以接受文字输入的大语言模型为主,但结合图像、音频甚至视频编解码类等模型算法,可以“看、听、说”的AI大模型已经渐行渐近。以阿里达摩院的Video-LLaMA为例,将视频分解为图像与音频,并按帧与秒进行切割,经过一系列编解码与运算,最终将视频转换成大语言模型可辨认的向量“input”,从而使得大语言模型“看懂”视频。我们认为,诸如将音像视频数据转化(预训练)、描述视频内容(推理生成)等过程亦需要消耗大量算力,随着大模型向多模态的不断演化,算力需求旺盛。 图10.使大模型能够“看懂”视频并解释 图11.部分视频语言预训练数据集示例 4NOA元年,车厂驾驶AI加速发力 车厂驾驶AI加速发力。今年小鹏、理想、华为等纷纷加速NOA(领航辅助驾驶)的进展,小鹏城市NGP北京首开,华为ADS2.0降低成本加快领航辅助驾驶落地,理想实现NOA早鸟推送并推出MindGPT升级理想同学,此外奔驰宣布其车载语言助手接入ChatGPT。今年以来车厂主要在城市NOA中加速发力,以华为为代表的智驾方案开始向强感知强算法倾斜,此外车厂积极接入GP