人工智能专题报告: 证券研究报告|2023年03月28日 生成式人工智能产业全梳理 行业研究·深度报告 投资评级:超配(维持评级) 证券分析师:熊莉xiongli1@guosen.com.cnS0980519030002 证券分析师:库宏垚kuhongyao@guosen.com.cnS0980520010001 证券分析师:朱松zhusong@guosen.com.cnS0980520070001 证券分析师:张伦可zhanglunke@guosen.com.cnS0980521120004 人工智能作为第四次科技革命,已经进入2.0时代。人工智能概念于1956年被提出,AI产业的第一轮爆发源自2012年,2012年AlexNet模型问世开启了CNN在图像识别的应用,2015年机器识别图像的准确率首次超过人(错误率低于4%),开启了计算机视觉技术在各行各业的应用。但是,人工智能1.0时代面临着模型碎片化,AI泛化能力不足等问题。2017年GoogleBrain团队提出Transformer架构,奠定了 大模型领域的主流算法基础,从2018年开始大模型迅速流行,2018年谷歌团队的模型参数首次过亿,到2022年模型参数达到5400亿,模型参数呈现指数级增长,“预训练+微调”的大模型有效解决了1.0时代AI泛化能力不足的问题。新一代AI技术有望开始全新一轮的技术创新周期。 自18年起大模型快速流行,有望重新定义生产力。2018年以来,预训练语言模型(PLM)及其“预训练-微调”方法已成为自然语言处理 (NLP)任务的主流范式,该范式先利用大规模无标注数据通过自监督学习预训练语言大模型,得到基础模型,再利用下游任务的有标 注数据进行有监督学习微调模型参数,实现下游任务的适配。在AI的1.0时代:存在模型碎片化明显、AI泛化能力不足等问题。“预训练+微调”大模型能显著降低AI工程化门槛,预训练大模型在海量数据的学习训练后具有良好的通用性和泛化性,细分场景的应用厂商能够基于大模型通过零样本、小样本学习即可获得显著的效果,使得人工智能有望构建成统一的智能底座,AI+赋能各行各业。本轮的生成式AI有望从简单的内容生成,逐步达到具有预测、决策、探索等更高的认知智能。 OpenAI当前已迭代五代模型,GPT-4开始布局多模态。OpenAI于2015年成立,微软于2019年开始与OpenAI建立战略合作伙伴关系,GPT共发布五代模型GPT-1、GPT-2、GPT-3、ChatGPT以及GPT4。GPT-1于2018年6月发布,首次将transformer与无监督的预训练技术相结合。2020年5月发布GPT-3,模型参数量为1750亿。2022年11月,OpenAI正式推出了对话交互式的ChatGPT。相比于GPT-3,ChatGPT引入了基 于人类反馈的强化学习(RLHF)技术以及奖励机制。2023年3月,OpenAI正式推出GPT-4,成为目前较先进的多模态大模型。GPT-4主要在识别理解能力、创作写作能力、处理文本量以及自定义身份属性迭代方面取得进展。 百度于2023年3月正式推出大模型文心一言。文心一言主要由文心大模型提供支持,文心一言拥有有监督精调、RLHF、提示构建、知识增强、检索增强和对话增强六大核心技术。其中前三项与ChatGPT的技术十分类似,知识增强包括知识内化和知识外用;检索增强指基于百度搜索引擎,先对内容进行检索,再筛选出有用的部分整合输出结果;对话增强指记忆机制、上下文理解和对话规划等技术。 投资建议:建议关注基础层与应用层AI龙头。应用层建议关注:科大讯飞、金山办公、同花顺、广联达、凌志软件、彩讯股份、拓尔思、福昕软件、税友股份等。基础层建议关注海光信息、浪潮信息、景嘉微等。 风险提示:AI技术商业化落地不及预期;行业竞争加剧,技术迭代风险;数据安全等政策不确定性;贸易摩擦风险。 01行业梳理:生成式AI有望带动新一轮技术创新周期 02 03 海外玩家:OpenAI持续领先,谷歌等巨头纷纷布局中国玩家:百度发布文心一言,中国玩家快速追赶 04 市场规模:模型参数不断增加,算力需求快速增长 05 商业模式:开启订阅制收费,不断开放API接口 06 应用场景:GPT走向多模态,下游应用场景不断打开 07 投资建议:建议关注基础层与应用层AI龙头 1、行业梳理:生成式AI有望带动新一轮技术创新周期 2012年至今属于人工智能的蓬勃发展期。人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能的发展历史大致可以被划分为5个阶段,2012年至今处于人工智能的蓬勃发展期,其分界点就是2012年前后IBM开发的人工智能程序“沃森”参加了一档智力问答节目并战胜了两位人类冠军以及AlexNet在ImageNet竞赛中取得胜利。 以深度神经网络为代表的信息技术的发展,推动了人工智能领域的进步与拓展。2006年,Hinton等人利用单层的RBM自编码预训练使得深层的神经网络训练得以实现;2012年,Hinton和AlexKrizhevsky设计的AlexNet神经网络模型在ImageNet竞赛中实现图像识别分类,成为新一轮人工智能发展的起点。 神经网络发展里程标志性事件AlexNet神经网络结构 资料来源:CSDN、国信证券经济研究所整理 资料来源:CSDN、国信证券经济研究所整理5 人工智能1.0时代(2012年-2018年):人工智能概念于1956年被提出,AI产业的第一轮爆发源自2012年,2012年AlexNet模型问世开启了CNN在图像识别的应用,2015年机器识别图像的准确率首次超过人(错误率低于4%),开启了计算机视觉技术在各行各业的应用,带动了人工智能1.0时代的创新周期,AI+开始赋能各行各业,带动效率提升。但是,人工智能1.0时代面临着模型碎片化,AI泛化能力不 足等问题。 人工智能2.0时代(2017年-至今):2017年GoogleBrain团队提出Transformer架构,奠定了大模型领域的主流算法基础,从2018年开始大模型迅速流行,2018年谷歌团队的模型参数首次过亿,到2022年模型参数达到5400亿,模型参数呈现指数级增长,“预训练+微调”的大模型有效解决了1.0时代AI泛化能力不足的问题。新一代AI技术有望开始全新一轮的技术创新周期。 2022年Gartner人工智能商业化曲线 资料来源:Gartner、国信证券经济研究所整理 人工智能有望迎来第四次科技革命 资料来源:ScalePartners、国信证券经济研究所整理 自18年起大模型快速流行,有望重新定义人工智能产业。2018年以来,预训练语言模型(PLM)及其“预训练-微调”方法已成为自然语言处理(NLP)任务的主流范式,该范式先利用大规模无标注数据通过自监督学习预训练语言大模型,得到基础模型,再利用下游任务的有标 注数据进行有监督学习微调模型参数,实现下游任务的适配。规模越大的模型不仅在已知任务上有着更好的表现,同时展现出完成更复杂的未知任务的强大泛化能力。 大模型示意图 资料来源:CSDN、国信证券经济研究所整理 基础模型的“预训练-微调”范式与传统深度学习区别 资料来源:清华大学、国信证券经济研究所整理 AI工程化门槛不断降低,有望重新定义生产力 AI的1.0时代:存在模型碎片化明显、AI泛化能力不足等问题,导致大多数行业需要花费巨大成本来收集和标注数据,从而导致规模不经济,而且下游场景存在诸多细分小场景,其商业化价值小、有效数据少、模型训练不足。 AI的2.O时代:“预训练+微调”大模型能显著降低AI工程化门槛,预训练大模型在海量数据的学习训练后具有良好的通用性和泛化性,细分场景的应用厂商能够基于大模型通过零样本、小样本学习即可获得显著的效果,使得人工智能有望构建成统一的智能底座,AI+赋能各行各业。本轮的生成式AI有望从简单的内容生成,逐步达到具有预测、决策、探索等更高的认知智能。 人工智能1.0时代与2.0时代 资料来源:创新工场、国信证券经济研究所整理 大模型将显著降低人工智能应用门槛 资料来源:IDC、国信证券经济研究所整理 人工智能产业链可分为基础层、技术层和应用层三大层面: 基础层:侧重基础支撑平台的搭建,包含传感器、AI芯片、数据服务和计算平台; 技术层:侧重核心技术的研发,主要包括算法模型、基础框架、通用技术; 应用层:注重产业应用发展主要包含行业解决方案服务、硬件产品和软件产品。 人工智能产业链 行业应用 金融零售医疗 安防教育工业 交通农业 应用层 产品应用 智能机器人 智能无人机 智能语音识别系统 智能搜索系统 通用技术 自然语言处理 智能语音 机器问答 计算机视觉 技术层 算法模型 机器学习 深度学习 增强学习 基础框架 分布式存储 分布式计算 神经网络 传感器 光学传感器 声学传感器 其他传感器 基础层 芯片 GPU FPGA ASIC 计算平台 数据服务 数据采集 数据处理 资料来源:36氪研究院、国信证券经济研究所整理 AI模型大致可以分为决策式AI和生成式AI两种。决策式AI指学习数据中的条件概率分布,根据已有数据进行分析、判断、预测,主要应用模型有用于推荐系统和风控系统的辅助决策、用于自动驾驶和机器人的决策智能体。生成式AI指学习数据中的联合概率分布,并非简单分析已有数据而是学习归纳已有数据后进行演技创造,基于历史进行模仿式、缝合式创作,生成了全新的内容,也能解决判别问题。 中国生成式AI商业应用规模迎来快速增长,预计2025年破两千亿。根据中关村大数据产业联盟发布的《中国AI数字商业展望2021-2025》报告披露,到2025年,中国生成式AI商业应用规模将达到2070亿元,未来五年的年均增速84%。根据Gartner《2021年预测:人工智能对人类和社会的影响》给出的积极预测,到2023年,将有20%的内容被生成式AI所创建。至2025年,预计生成式AI产生的数据将占所有数据的 10%。 生成式AI应用场景 2020-2025年中国生成式AI技术栈应用规模(亿元) 2070 1606 1077 663 343 98 2500 2000 1500 1000 500 0 202020212022202320242025 资料来源:知乎、国信证券经济研究所整理 资料来源:《中国AI数字产业展望2021-2025》、国信证券经济研究所整理 10 人工智能在经历前期技术积累和迭代后,逐渐突破传统分析型AI领域,迎来生成式AI的爆发期。从2012年至今,生成式AI急速发展,其源头就是DNN算法的升级,实现了语音和图像识别等功能。 生成式AI市场前景广阔,赛道内诞生多家独角兽企业。据波士顿咨询预测,至2025年生成式人工智能的市场规模将至少达到600亿美元,而其中大约30%的AI应用将来自广义的生成式AI技术。随着生成式AI模型的进一步完善,自主创作和内容生产的门槛将大大降低,市场响应该领域的巨大需求,在2019-2022年间共有7家独角兽公司诞生,截至2023年2月,这七家的估值合计达到644亿美元,其中OpenAI借 助旗下产品ChatGPT爆火的东风,一家公司的估值便突破290亿美元。 生成式AI竞争格局生成式AI领域独角兽公司及其公司市值(亿美元) 公司市值(亿美元) 900 800 700 600 500 400 300 200 100 OpenAI 0 290 130 10 15 40 16 2019 2020 2022 796 grammarly ada glean Jasper stability.ai CREASTA 资料来源:澳财、国信证券经济研究所整理 资料来源:CSDN、国信证券经济研究所整理11 生成式AI在文本(Text)、代码生成(Codegeneration)、图片(Image