[Table_Title] 评级及分析师信息 [Table_IndustryRank] 1、生成式AI应用引发网络热议,底层技术迭代更新推动AI应 [Table_Summary] 用行业迎来新一轮爆发机遇。我们认为,从AIGC技术栈三大层 次出发,有以下三大特征: 1)应用层:多模态技术推动领域间融合,生成式AI应用逐渐 迈向大众视野,进入规模化阶段。在多模态技术帮助下应用体 验深度和广度扩大,逐渐深度融入到文字、音乐、图片、视 频、3D多种媒介形式的生产中,从效果而言,在自然语言的文 本、语音、图片生成以及代码编写领域表现最为突出。 尽管如 此,由于部分模型的开源生态,生成式AI在技术上差异壁垒相 对传统深度学习较小。国内相关企业种类繁多,在语音语义领 域包括科大讯飞、拓尔思(NLP模型)、神州泰岳(NLP基础服 务)百度大脑、思必驰等,图像、视频识别领域包括海康威 视,计算机视觉领域包括商汤、云从科技、依图、阿里云、腾 分析师:宋辉 [Table_Author] 讯云、影谱等。 邮箱:songhui@hx168.com.cn 2)模型层:基础生成算法模型不断突破创新,目前语义识别 SAC NO:S1120519080003 主导模型是GPT-3/3.5, 而图像生成的多模态模型主要以 联系电话: Diffusion Model为主。国内商用版AI应用模型平台主要以决 分析师:柳珏廷 策型AI为主,主要包括商汤、旷视、萨摩耶云、第四范式等。 邮箱:liujt@hx168.com.cn 还有部分开放平台,包括BAT、商汤、科大讯飞开放平台、华 SAC NO:S1120520040002 为等。 联系电话: 我们认为,基础层预训练模型能够为下游应用提供快速发展基 础,是行业整体生态中至关重要的一环,但是由于下游应用的 收入分布极度不均,头部聚集,因此模型公司或平台主要收入 来源均来自于下游头部的应用商;尽管包括Stability AI在内 的众多模型公司仍是尚未专注于商业化的早期新兴公司,但是 在下游杀手级应用逐渐构建,单个应用发展到一定量级,均会 开始考虑自建训练模型,导致其商用价值始终得不到充分释 放,比如Ahthropic、Cohere等自行构建的大语言模型等。而 同质化的下游应用想要突破创新,对于更加个性化、垂直行业 的模型需求也会愈加强烈。因此预训练大模型向MaaS的商业化 转型落地将逐渐成为更有可能的一种发展方向。 3)基础设施层:目前生成式AI市场大量产业价值最终流向底 层基础设施,包括云厂商和芯片硬件厂商等。国内相关企业包 括云厂商阿里云、腾讯云、华为云、百度智能云、天翼云等; 服务器等数通设备厂商包括:紫光股份、中兴通讯、浪潮信 息、朝聚变等;AI&GPU芯片厂商包括寒武纪、天数智芯、芯动 科技、登临科技、沐曦科技、燧原科技、地平线等,另外考虑 到目前国内AI算力芯片受到封锁较为严重,对于制程要求不高 的光子计算预计也将会成为后续发展重点,相关公司包括光子 算数、曦智科技等。 2、通信板块观点 1)低估值、高股息,必选消费属性强的电信运营商(A+H)板 块:中国移动、中国电信、中国联通; 2)低估值成长依旧的主设备:紫光股份(华西通信&计算机联合 覆盖)、中兴通讯; 3)东数西算产业链中IDC、光模块板块:光环新网、奥飞数据、 新易盛、天孚通信、光迅科技、中际旭创等; 4)高成长物联网模组及能源信息化板块:移远通信、朗新科技 (华西通信&计算机联合覆盖)、威胜信息等; 5)10G-PON及家庭宽带设计产业链:平治信息、天邑股份等; 6)其他个股方面:海格通信(北斗三号渗透率提升)(华西通信 &军工联合覆盖)、新雷能(华西通信&军工联合覆盖)、TCL科技 (面板价格触底)(华西通信&电子联合覆盖)、七一二(军工信 息化)、金卡智能(华西通信&机械联合覆盖)等 3、风险提示 技术更新发展不及预期;应用普及不及预期;商用化落地不及预 期。 1.AIGC应用引发网络热议,底层技术迭代更新推动AI应用 行业迎来新一轮爆发机遇 在过去的一年时间里,以ChatGPT、Midjourney等为代表的生成式AI应用引发巨 大浪潮,在AIGC的技术栈支持下,小公司也能通过使用第三方模型来搭建自己的应用, 从而极大降低应用开发的门槛,也催生了多种多样、种类繁多的应用生态。 1.1.生成式AI的技术栈 生成式AI技术栈包括以下三个层次,分别是: 应用层:将生成式AI模型集成进面向用户的应用软件,又分为基于自有模型 或依赖于第三方模型的API,包括Midjourney、Runway、Jasper、Github Copliot等; 模型层:以开源或闭源API方式提供模型,赋能应用产品,其中开源模型需 要一个对应的托管方案; 基础设施层:负载生成式AI模型的训练和推理,包括云厂商和硬件提供商。 1.2.多模态技术推动领域间融合,生成式AI应用逐渐迈向大众 视野,进入规模化阶段 在过去的一年时间里,以ChatGPT、Midjourney等为代表的生成式AI应用引发巨 大浪潮,在AIGC的技术栈支持下,小公司也能通过使用第三方模型来搭建自己的应用, 从而极大降低应用开发的门槛,也催生了多种多样、种类繁多的应用生态,AI应用也 因此有机会成为一种平台型服务应用,未来应用场景的价值挖掘潜力极大。 资料来源:腾讯研究院,华西证券研究所 在多模态技术帮助下应用体验深度和广度扩大,逐渐深度融入到文字、音乐、图 片、视频、3D多种媒介形式的生产中,从效果而言,在自然语言的文本、语音、图片 生成以及代码编写领域表现最为突出。相对新颖的产品模式和互联网多样的触达模式 推动其应用程序能够爆发式增长,经历多个爆款,生成式AI技术革新逐渐走向大众视 野。其中,多模态技术是推动了AIGC的内容多样性的基石。2021年,OpenAI团队对 跨模态深度学习模型CLIP进行开源,它能够同时进行自然语言理解和计算机视觉分析, 实现图像和文本的匹配,同时训练模型中也包含了互联网上的图片和文字描述, 形成 天然庞大的训练样本。比如AI绘画产品就能通过一句文字理解并自动生成一副图像。 CLIP让文字和图片两种模态找到交织点,成为DALL.E、Stable Diffusion等突破性 AIGC成果的基石 , 而近期爆款的Midjourney、Runway等应用均是基于Stable Diffusion模型创造的应用。 资料来源:腾讯研究院引用自红杉资本,华西证券研究所 尽管如此,由于部分模型的开源生态,生成式AI在技术上差异壁垒相对传统深度 学习较小。以往的深度学习模型中,模型具备明显的规模优势,能够催生一定的规模 壁垒,但对于生成式AI,则无法通过模型规模来产生足够壁垒。小公司可能直接选取 适用的托管方案与开源模型来形成自己的应用。因此,由于众多应用开发商依赖于类 似的基础模型,应用领域也相对狭窄,许多应用软件在产品层面相似度很高,产品间 同质化明显,导致应用软件对用户留存度偏低,难形成差异化壁垒。同时由于自有或 开源模型的不同,其模型推理成本也有所差异,使得应用层产品间毛利率也存在很大 差异。 1.3.产业生态雏形初现,大模型商用价值体现较难,模型及服 务(MaaS)或许是未来方向 基础生成算法模型不断突破创新,目前语义识别主导模型是GPT-3/3.5,而 图像生成的多模态模型主要以DiffusionModel为主。2014年,伊恩·古德费洛 提出生成对抗网络(GAN),是早期最著名的生成模型,被广泛用于生成图像、视 频、语音和3D模型等。随后,Transformer、基于流的生成模型(Flow-based models)、扩散模型(Diffusion Model)等深度学习的生成算法相继涌现。其中, Transformer模型被广泛用于自然语言处理(NLP)、计算机视觉(CV)等领域, 后来出现的BERT、GPT-3、LaMDA等预训练模型都是基于Transformer模型建立, 其中基于GPT-3/3.5和ChatGPT的OpenAI在NLP领域占据主导地位。而Diffusion Model已逐渐取代GAN成为最先进的图像生成器。国内大模型包括百度文心、北 京智源的悟道2.0、华为的盘古NLP大模型等。 在AIGC产业的模型生态中,也包含以预训练模型为主的技术基础层和垂直化、 场景化、个性化的中间层模型。 基础层由于预训练模型的高成本和技术投入,具有较高的进入门槛,代表包 OpenAI商业模式主要是对受控的API调用收费,在自然语言模型中, OpenAI以GPT-3/3.5和ChatGPT占据主导地位;尽管如此,基于OpenAI 构建的杀手级应用还相对较少,其API定价也有过一次下调。 而Stability AI以基础版完全开源为主,在图像生成领域,Stable Diffusion开源社区飞速增长,得益于其用户界面、托管产品和微调方 法等组成的操作生态,诞生了包括Midjourney在内的众多爆款。不过 Stability仍持续以开源作为愿景免费提供其主要检查点,其商用化落 地主要通过开发和销售专业版和定制版实现商业获利。 而中间层,主要是在预训练大模型基础上快速抽取生成场景化、定制化和个 性化的小模型 , 实现多行业 、 垂直场景 、 多功能的部署 。 比如在Stable Diffusion开源基础上诞生的二次元画风生成的Novel-AI等。 我们认为,基础层预训练模型能够为下游应用提供快速发展基础,是行业整 体生态中至关重要的一环,但是由于下游应用的收入分布极度不均,头部聚集, 因此模型公司或平台主要收入来源均来自于下游头部的应用商 ;尽管包括 StabilityAI在内的众多模型公司仍是尚未专注于商业化的早期新兴公司,但是 在下游杀手级应用逐渐构建,单个应用发展到一定量级,均会开始考虑自建训练 模型,导致其商用价值始终得不到充分释放,比如Ahthropic、Cohere等自行构 建的大语言模型等。而同质化的下游应用想要突破创新,对于更加个性化、垂直 行业的模型需求也会愈加强烈。因此预训练大模型向MaaS的商业化转型落地将逐 渐成为更有可能的一种发展方向。 无论是训练模型的模型提供商和科研实验室、执行推理微调的托管公司或者 根据美国投资机构Andreessen Horowitz(a16z)预计,应用程序公司平均 将约20-40%的年收入用于推理和定制化微调,这部分通常直接支付给云厂商或第 三方模型提供商,而模型提供商也需要将50%左右的收入继续投入到云基础设施 中。此外,对于训练自有模型的初创公司来说,早期的风险投资也大多投入到包 括AWS、GCP、Azure、阿里等云厂商中,而AI算力也受限于有限的供应,运行绝 大多数AI工作负载的主要芯片厂商是英伟达(Nvidia)。其他硬件厂商包括谷歌 TPU、AMDInstinctGPU、AWSInferentia和Trainium芯片、英特尔的Havana和 PonteVecchio GPU,以及来自Cerebras、Sambanova和Graphcore等初创公司的 AI加速器。国内方面,训练芯片包括华为昇腾、百度昆仑、寒武纪等云端训练芯 片系列相继发布,推理芯片方面,寒武纪、商汤、嘉楠百度、华为、比特大陆、 燧远科技等均有所布局。 2.相关企业梳理 1)应用层:多模态技术推动领域间融合,生成式AI应用逐渐迈向大众视野,进 入规模化阶段。在多模态技术帮助下应用体验深度和广度扩大,逐渐深度融入到 文字、音乐、图片、视频、3D多种媒介形式的生产中,从效果而言,在自然语言 的文本、语音、图片生成以及代