“好智多模”——生成式人工智能的浪潮与未来 人工智能产业深度系列报告(二) 摘要AI领域再进一步,生成式人工智能(GenAI)市场空间广阔。作为按照输入提示(prompt)生成语言文字、图像、视频等多媒体内容的人工智能系统,GenAI的出现标志着人工智能技术向着泛化能力更强的创造性应用领域拓展,其中如ChatCPT、Gemini、Sora等最具代表性的应用令产业与资本市场对AI行业的关注度再度提升。在Transformer模型的基础上,GenAI所衍生出的三条技术路线及多模态发展趋势令其未来潜力巨大:预计至2032年GenAI的市场规模将达1.36万亿美元,年均复合增速达到34%,占全球科技行业市场规模的占比也将提升至近13%。 GenAI的应用已跨越地理界限,渗透至千行百业。相关调查结果显示,全球80%的受访者已经使用GenAI工具,尤其以北美和亚太地区为主,并且应用普及范围已经覆盖工作内外等不同场景。GenAI正快速且广泛地渗透至各行各业,特别是科技、教育、商业服务、制造等行业的渗透率相对较高,仅在文化、农业等个别行业GenAI的应用仍有较大发展空间。 全球科技企业竞争格局初现,美国领先,中国紧追。全球头部科技公司在算力与模型平台呈现不同的市场竞争格局:一方面,英伟达在GPU市场占据92%的份额,并通过CUDA等软件生态系统巩固其领先地位;另一方面,如OpenAI、谷歌、微软等公司在技术创新与应用方面保持领先,特别是OpenAI的GPT-4模型以近1.8万亿的庞大参数量与卓越的性能成为当前全球最强大的GenAI模型之一。中国的GenAI大模型在训练数据、算法、算力等方面与国际先进水平相比仍存一定差距,但百度、阿里巴巴等公司在中文处理及行业应用方面具备一定优势,未来或展现出迅猛的发展势头。 GenAI的未来:多维度的创新与挑战共存。我们认为,未来GenAI将展现出“多开能小”的创新化特征:多模态大模型(LMM)时代全面到来,开源模型成为行业主流,AI智能体的广泛应用成为常态,小语言模型(SLM)与边缘AI的结合能开发出新应用方向。然而,GenAI的快速发展或也将引发相关社会与经济问题,譬如就业市场可能受到冲击、知识产权保护界限模糊,以及虚假信息泛滥等。预计政府将与企业、教育机构等社会各界通力合作,通过加强新兴产业支持、完善法律法规、培养AI相关技能、确保数据安全与内容监管等措施,寻求技术创新与社会责任之间的平衡,确保GenAI可以持续健康发展。 风险提示:技术发展不及预期;监管政策持续收紧;行业竞争持续加剧 2024年3月27日 行业:人工智能 李好Leo,PhD +8523150-7328 leo.li@cncbinvestment.comSFC:BUC327 相关报告 1.人工智能深度系列报告之一:智绘未来——人工智能的星辰大海|2024-02-28 Pleaseseelastpageforanalyst’sdeclaration,disclaimeranddisclosureofinterest. 请参见尾页分析师声明、免责声明及利益申报1 正文目录 写在前面4 1.技术突飞猛进,市场前景乐观4 1.1GenAI:人工智能的前沿技术4 1.2市场规模:总量前景可观,软件后来居上5 1.3技术发展:厚积薄发与“三江并流”6 1.4能力优势:“理解”语言、个性化输出与可解释性8 2.普及五洲四洋,渗透千行百业10 2.1全球图景:分类场景迅速普及10 2.2行业分布:科技与教育名列前茅10 3.科技企业竞逐,营收迅速增长12 3.1市场格局:硬件与模型格局迥异12 3.2头部企业:GenAI业务迅速增长13 4.发展趋势多元,面临挑战严峻20 4.1“多开能小”:摆脱发展趋势单一化的特征20 4.2行业潜在挑战与可能应对22 5.附录:生成式人工智能发展历程中的关键技术25 图表目录 图表1:GenAI与大模型等相关概念的关系5 图表2:GenAI大模型参数量呈指数级增长5 图表3:GenAI市场规模增长预测6 图表4:从Transformer衍生出的三种架构7 图表5:GenAI大模型的三条技术路线与发展阶段8 图表6:自2023年起未来五年全球商业服务所受影响9 图表7:全球不同地区用户对GenAI分场景使用情况10 图表8:2023年不同行业中使用ChatGPT的公司占比11 图表9:分行业与使用场景GenAI使用占比12 图表10:2023全球GPU市场份额划分12 图表11:2023全球GenAI模型与平台市场份额划分12 图表12:GPT-4在GSM8K对众多GenAI模型的评分中保持领先13 图表13:2023谷歌主营构成14 图表14:谷歌云营收增长14 图表15:2023微软主营构成15 图表16:微软智能云营收增长15 图表17:2023亚马逊主营构成15 图表18:亚马逊网络服务营收增长15 图表19:2023英伟达主营构成16 图表20:英伟达数据中心营收增长16 图表21:截至2023年大型科技公司累计收购人工智能初创企业数量17 图表22:2023百度营收构成19 图表23:百度核心业务营收增长19 图表24:2023阿里巴巴营收构成19 图表25:阿里云业务营收增长19 图表26:商汤营收增长20 图表27:开源与专有模型的性能表现21 图表28:GenAI对美国就业市场的影响22 图表29:对ChatGPT担忧状况的调查23 写在前面 近年来,人工智能领域的一系列突破性进展令我们身处新一代产业革命的浪潮中,尤其是ChatGPT、GPT-4、文心一言、通义千问、星火大模型、Gemini、Sora等生成式人工智能产品的密集发布,使人工智能应用更加广泛地渗透到人们的生产与生活中。资本市场与全球相关产业链同样为之振奋:在GenAI大模型研发与部署领域,OpenAI、微软、谷歌、百度、商汤以及清华智谱等公司展现出空前的创新能力并开拓多元化的应用领域;在AI基础设施领域,英伟达、超微电脑、亚马逊等公司正吸引全球投资者的目光。 在此背景下,本报告旨在介绍GenAI技术的理论基础、市场应用、代表性头部公司等,同时探讨这一技术对经济与社会的深刻影响,以帮助投资者更好地理解GenAI并发掘投资机会。 1.技术突飞猛进,市场前景乐观 1.1GenAI:人工智能的前沿技术 生成式人工智能(GenerativeArtificialIntelligence,GenAI,亦称为ArtificialIntelligenceGeneratedContent,AIGC)是一种能够基于输入提示生成文字、图像、音乐、视频或其他多媒体内容的人工智能系统。作为人工智能领域的一个分支,GenAI在传统AI功能如数据分析与图像识别的基础上,引入了语言文字生成(包括自然语言、代码、基因语言等)、图像生成、音频生成与视频生成等多样化能力,标志着人工智能技术向着泛化能力更强的创造性应用领域拓展。 GenAI实现内容生成功能的主体是模型。根据模型规模、模型功能等区别,模型可分为大模型(LargeModel)、大语言模型、多模态大模型等不同类别(图表1)。其中,大模型是具有大规模参数和复杂计算结构的机器学习模型,通常由深度神经网络构建而成,拥有数十亿或更多参数。大语言模型(LargeLanguageModel,LLM)是具有大规模参数的自然语言处理(NaturalLanguageProcessing)模型。GenAI模型的第一阶段通常是LLM,然而随着GPT-4V、Gemini、Sora等模型的相继发布,更为先进的多模态大模型(LargeMultimodalModels,LMM)逐渐成为行业与市场关注的焦点。LMM可以被视为LLM的演进,在LLM的基础之上实现多媒体内容的处理功能,是人工智能技术在模型泛化能力上的重大进步。 图表1:GenAI与大模型等相关概念的关系 资料来源:公开资料,CNCBResearch 自诞生以来,GenAI模型能力迅速提升,同时其参数量呈指数级增长。GenAI模型往往使用深度学习架构并拥有大规模参数,且因为模型的规模与能力往往呈正相关,所以近年来GenAI模型的发展伴随着参数量指数级增长。自2018年GPT-1的1.17亿至2023年GPT-4的1.76万亿,大模型参数在五年时间内增长一万倍以上 (图表2)。 (参数量) MT-NLG (MSFT/NVDA) GPT-4(OpenAI) GPT-3(OpenAI) PaLM(Google) Gopher(Google) Megatron-LM (NVDA) GPT-2(OpenAI) Jurassic-1(AI21) Turing-NLG(MSFT) GPT-1(OpenAI) BERT(Google) 图表2:GenAI大模型参数量呈指数级增长 1.E+13 1.E+12 1.E+11 1.E+10 1.E+09 1.E+08 1.E+07 2018201920202021202220232024 资料来源:公开资料,CNCBResearch 1.2市场规模:总量前景可观,软件后来居上 全球GenAI市场规模的增长前景巨大。根据多家市场机构的预测,全球GenAI市场规模将以34%的复合年均增速自2023年635亿美元升至2032年1.36万亿美元(图表3)。在此期间,GenAI对整体科技行业市场规模的贡献比例将由2023年的1.3%上升至2032年的12.4%。 图表3:GenAI市场规模增长预测 (十亿美元) 硬件 IT服务广告投放 占科技行业市场规模的比例(右轴) 软件 商业服务游戏 1500 15% 1000 10% 5005% 00% 20232024E2025E2026E2027E2028E2029E2030E2031E2032E 资料来源:BloombergIntelligence,IDC,eMarketer,Statista,CNCBResearch 硬件领域增速放缓,软件与广告领域后来居上。从GenAI细分领域市场的预测数据来看,硬件领域将以27%的复合年均增速升至2032年6390亿美元(图表3),但是其在GenAI市场规模占比将由2024年的73.6%降至2032年的47.0%。相较而言,软件与广告投放领域的增长将更为迅速:其中,软件市场将以52%的复合年均增速持续扩大,至2032年市场规模将达3180亿美元,其占在GenAI市场规模的比重占比预计从8.8%升至23.4%;广告投放市场将以45%的复合年均增速升至2032年达2067亿美元,占比从8.3%升至15.2%。我们认为,一方面,作为GenAI的基础设施,硬件算力作为基础设施在行业发展前期占据更为重要的地位,其迅速扩张为人工智能领域未来的日后的蓬勃发展奠定坚实基础;。另一方面,软件及广告在开发速度与应用广度上更有优势,其占在GenAI市场规模的比重占比将后来居上、超越硬件。 1.3技术发展:厚积薄发与“三江并流” GenAI的诞生标志着人工智能技术经过长期积累后进入新的发展阶段,可谓厚积薄发。21世纪的人工智能发展可以分成三个主题:优化算法探索、图像识别技术突破,以及GenAI兴起。首个主题以机器学习等优化算法为核心,在21世纪初十年迅速发展,成为分析海量数据、提取信息、识别模式并进行预测的强大工具。第二主题以深度学习在图像识别技术的应用为关键,2012年由AlexNet模型的推出开启。第三主题以GenAI技术为核心,先经过多年技术积累,并于2017年由Transformer模型问世开启。Transformer之前,GenAI技术的演进历程主要聚焦于序列数据处理与多模态数据融合这两大核心领域。在序列数据方面,技术进步主要得益于循环神经网络(RNN)、长短期记忆网络(LSTM)、门控循环单元(GRU)以及序列到序列(Seq2seq)等模型的应用。在多模态数据处理方面,生成对抗网络(GAN)与变分自编码器 (V