证券研究报告|行业点评报告 2023年02月05日 数字经济专题报告之十三:生成式AI引发热议,相关产业链视野梳理 评级及分析师信息 行业评级:推荐行业走势图 8%2%-5%-11%-18% -24% 2022/022022/052022/082022/11 通信沪深300 分析师:宋辉邮箱:songhui@hx168.com.cnSACNO:S1120519080003联系电话:分析师:柳珏廷邮箱:liujt@hx168.com.cnSACNO:S1120520040002联系电话: 通信行业 1、生成式AI应用引发网络热议,底层技术迭代更新推动AI应用行业迎来新一轮爆发机遇。我们认为,从AIGC技术栈三大层次出发,有以下三大特征: 1)应用层:多模态技术推动领域间融合,生成式AI应用逐渐迈向大众视野,进入规模化阶段。在多模态技术帮助下应用体验深度和广度扩大,逐渐深度融入到文字、音乐、图片、视频、3D多种媒介形式的生产中,从效果而言,在自然语言的文本、语音、图片生成以及代码编写领域表现最为突出。尽管如此,由于部分模型的开源生态,生成式AI在技术上差异壁垒相对传统深度学习较小。国内相关企业种类繁多,在语音语义领域包括科大讯飞、拓尔思(NLP模型)、神州泰岳(NLP基础服务)百度大脑、思必驰等,图像、视频识别领域包括海康威视,计算机视觉领域包括商汤、云从科技、依图、阿里云、腾讯云、影谱等。 2)模型层:基础生成算法模型不断突破创新,目前语义识别主导模型是GPT-3/3.5,而图像生成的多模态模型主要以DiffusionModel为主。国内商用版AI应用模型平台主要以决策型AI为主,主要包括商汤、旷视、萨摩耶云、第四范式等。还有部分开放平台,包括BAT、商汤、科大讯飞开放平台、华为等。 我们认为,基础层预训练模型能够为下游应用提供快速发展基础,是行业整体生态中至关重要的一环,但是由于下游应用的收入分布极度不均,头部聚集,因此模型公司或平台主要收入来源均来自于下游头部的应用商;尽管包括StabilityAI在内的众多模型公司仍是尚未专注于商业化的早期新兴公司,但是在下游杀手级应用逐渐构建,单个应用发展到一定量级,均会开始考虑自建训练模型,导致其商用价值始终得不到充分释放,比如Ahthropic、Cohere等自行构建的大语言模型等。而同质化的下游应用想要突破创新,对于更加个性化、垂直行业的模型需求也会愈加强烈。因此预训练大模型向MaaS的商业化转型落地将逐渐成为更有可能的一种发展方向。 3)基础设施层:目前生成式AI市场大量产业价值最终流向底层基础设施,包括云厂商和芯片硬件厂商等。国内相关企业包括云厂商阿里云、腾讯云、华为云、百度智能云、天翼云等;服务器等数通设备厂商包括:紫光股份、中兴通讯、浪潮信息、朝聚变等;AI&GPU芯片厂商包括寒武纪、天数智芯、芯动科技、登临科技、沐曦科技、燧原科技、地平线等,另外考虑到目前国内AI算力芯片受到封锁较为严重,对于制程要求不高 请仔细阅读在本报告尾部的重要法律声明 的光子计算预计也将会成为后续发展重点,相关公司包括光子算数、曦智科技等。 2、通信板块观点 1)低估值、高股息,必选消费属性强的电信运营商(A+H)板块:中国移动、中国电信、中国联通;2)低估值成长依旧的主设备:紫光股份(华西通信&计算机联合覆盖)、中兴通讯; 3)东数西算产业链中IDC、光模块板块:光环新网、奥飞数据、新易盛、天孚通信、光迅科技、中际旭创等;4)高成长物联网模组及能源信息化板块:移远通信、朗新科技 (华西通信&计算机联合覆盖)、威胜信息等; 5)10G-PON及家庭宽带设计产业链:平治信息、天邑股份等; 6)其他个股方面:海格通信(北斗三号渗透率提升)(华西通信&军工联合覆盖)、新雷能(华西通信&军工联合覆盖)、TCL科技 (面板价格触底)(华西通信&电子联合覆盖)、七一二(军工信息化)、金卡智能(华西通信&机械联合覆盖)等 3、风险提示 技术更新发展不及预期;应用普及不及预期;商用化落地不及预期。 1.AIGC应用引发网络热议,底层技术迭代更新推动AI应用行业迎来新一轮爆发机遇 在过去的一年时间里,以ChatGPT、Midjourney等为代表的生成式AI应用引发巨大浪潮,在AIGC的技术栈支持下,小公司也能通过使用第三方模型来搭建自己的应用,从而极大降低应用开发的门槛,也催生了多种多样、种类繁多的应用生态。 1.1.生成式AI的技术栈 生成式AI技术栈包括以下三个层次,分别是: 应用层:将生成式AI模型集成进面向用户的应用软件,又分为基于自有模型或依赖于第三方模型的API,包括Midjourney、Runway、Jasper、GithubCopliot等; 模型层:以开源或闭源API方式提供模型,赋能应用产品,其中开源模型需要一个对应的托管方案; 基础设施层:负载生成式AI模型的训练和推理,包括云厂商和硬件提供商。图1生成式AI的技术栈 资料来源:a16z,华西证券研究所 1.2.多模态技术推动领域间融合,生成式AI应用逐渐迈向大众视野,进入规模化阶段 在过去的一年时间里,以ChatGPT、Midjourney等为代表的生成式AI应用引发巨大浪潮,在AIGC的技术栈支持下,小公司也能通过使用第三方模型来搭建自己的应用,从而极大降低应用开发的门槛,也催生了多种多样、种类繁多的应用生态,AI应用也因此有机会成为一种平台型服务应用,未来应用场景的价值挖掘潜力极大。 图2AIGC在内容生成领域的五大优势 提高内容质 量 自动内容 生成 增加内容多 样性 内容制作 成本低、 门槛低 可实现个性 化内容生成 资料来源:腾讯研究院,华西证券研究所 在多模态技术帮助下应用体验深度和广度扩大,逐渐深度融入到文字、音乐、图片、视频、3D多种媒介形式的生产中,从效果而言,在自然语言的文本、语音、图片生成以及代码编写领域表现最为突出。相对新颖的产品模式和互联网多样的触达模式推动其应用程序能够爆发式增长,经历多个爆款,生成式AI技术革新逐渐走向大众视野。其中,多模态技术是推动了AIGC的内容多样性的基石。2021年,OpenAI团队对跨模态深度学习模型CLIP进行开源,它能够同时进行自然语言理解和计算机视觉分析,实现图像和文本的匹配,同时训练模型中也包含了互联网上的图片和文字描述,形成天然庞大的训练样本。比如AI绘画产品就能通过一句文字理解并自动生成一副图像。CLIP让文字和图片两种模态找到交织点,成为DALL.E、StableDiffusion等突破性AIGC成果的基石,而近期爆款的Midjourney、Runway等应用均是基于StableDiffusion模型创造的应用。 图3AIGC应用现状概览 资料来源:腾讯研究院引用自红杉资本,华西证券研究所 尽管如此,由于部分模型的开源生态,生成式AI在技术上差异壁垒相对传统深度学习较小。以往的深度学习模型中,模型具备明显的规模优势,能够催生一定的规模壁垒,但对于生成式AI,则无法通过模型规模来产生足够壁垒。小公司可能直接选取适用的托管方案与开源模型来形成自己的应用。因此,由于众多应用开发商依赖于类似的基础模型,应用领域也相对狭窄,许多应用软件在产品层面相似度很高,产品间同质化明显,导致应用软件对用户留存度偏低,难形成差异化壁垒。同时由于自有或开源模型的不同,其模型推理成本也有所差异,使得应用层产品间毛利率也存在很大差异。 1.3.产业生态雏形初现,大模型商用价值体现较难,模型及服务(MaaS)或许是未来方向 基础生成算法模型不断突破创新,目前语义识别主导模型是GPT-3/3.5,而图像生成的多模态模型主要以DiffusionModel为主。2014年,伊恩·古德费洛提出生成对抗网络(GAN),是早期最著名的生成模型,被广泛用于生成图像、视频、语音和3D模型等。随后,Transformer、基于流的生成模型(Flow-basedmodels)、扩散模型(DiffusionModel)等深度学习的生成算法相继涌现。其中,Transformer模型被广泛用于自然语言处理(NLP)、计算机视觉(CV)等领域,后来出现的BERT、GPT-3、LaMDA等预训练模型都是基于Transformer模型建立,其中基于GPT-3/3.5和ChatGPT的OpenAI在NLP领域占据主导地位。而DiffusionModel已逐渐取代GAN成为最先进的图像生成器。国内大模型包括百度文心、北京智源的悟道2.0、华为的盘古NLP大模型等。 表1国外主要的AIGC预训练模型一览 领域国外主要的AIGC预训练模型 自然语言处理(NLP) Google:BERT、LaMDA、PaLMMicrosoft:Turing-NLGFacebook:OPT-175B、M2M-100 DeepMind:Gopher、AlphaCode(代码编写)OpenAI:GPT3、Codex(代码编写)、ChatGPTNvidia:Megatron-TuringNLG 计算机视觉(CV)Microsoft:Florence Google:Imagen、Parti 多模态 DeepMind:Gato(多面手的智能体)OpenAI:CLIP&DALL-E StabilityAI:StableDiffusion 资料来源:腾讯研究院,华西证券研究所整理 在AIGC产业的模型生态中,也包含以预训练模型为主的技术基础层和垂直化、场景化、个性化的中间层模型。 基础层由于预训练模型的高成本和技术投入,具有较高的进入门槛,代表包括OpenAI、StabilityAI等。 OpenAI商业模式主要是对受控的API调用收费,在自然语言模型中,OpenAI以GPT-3/3.5和ChatGPT占据主导地位;尽管如此,基于OpenAI构建的杀手级应用还相对较少,其API定价也有过一次下调。 而StabilityAI以基础版完全开源为主,在图像生成领域,StableDiffusion开源社区飞速增长,得益于其用户界面、托管产品和微调方法等组成的操作生态,诞生了包括Midjourney在内的众多爆款。不过Stability仍持续以开源作为愿景免费提供其主要检查点,其商用化落地主要通过开发和销售专业版和定制版实现商业获利。 而中间层,主要是在预训练大模型基础上快速抽取生成场景化、定制化和个性化的小模型,实现多行业、垂直场景、多功能的部署。比如在StableDiffusion开源基础上诞生的二次元画风生成的Novel-AI等。 我们认为,基础层预训练模型能够为下游应用提供快速发展基础,是行业整体生态中至关重要的一环,但是由于下游应用的收入分布极度不均,头部聚集,因此模型公司或平台主要收入来源均来自于下游头部的应用商;尽管包括StabilityAI在内的众多模型公司仍是尚未专注于商业化的早期新兴公司,但是在下游杀手级应用逐渐构建,单个应用发展到一定量级,均会开始考虑自建训练模型,导致其商用价值始终得不到充分释放,比如Ahthropic、Cohere等自行构 建的大语言模型等。而同质化的下游应用想要突破创新,对于更加个性化、垂直行业的模型需求也会愈加强烈。因此预训练大模型向MaaS的商业化转型落地将逐渐成为更有可能的一种发展方向。 1.4.早期产业价值流向底层基础设施 无论是训练模型的模型提供商和科研实验室、执行推理微调的托管公司或者自建模型的应用程序公司,对底层计算的需求都需要通过云托管的GPU或TPU等来实现,因此生成式AI市场大量产业价值最终流向底层基础设施,包括云厂商和芯片硬件厂商等。 根据美国投资机构AndreessenHorowitz(a16z)预计,应用程序公司平均将约20-40%的年收入用于推理和定制化微调,这部分通常直接支付给云厂商或第三方模型提供商,而模型提供商也需要将50%左右的收入继续投入到云基础设施中。