国信证券证券研究报告「2023年03月28日 GUOSENSECURITIES 人工智能专题报告: 生成式人工智能产业全梳理 行业研究:深度报告 投资评级:超配(维持评级) 证券分析师:熊莉 证券分析师:库宏 证券分析师:朱松 证券分析师:张伦可 xiongli1@guosen.com.cn kuhongyao@guosen.com.cn zhusong@guosen.com.cn zhanglunke@guosen.com.cn S0980519030002 S0980520010001 S0980520070001 S0980521120004 请务公阅设正文之后的免费声明及只项下所右内客 报告摘要 >人工智能作为第四次科技革命,已经进入2.0时代。人工智能概念于1956年被提出,A1产业的第一轮爆发源自2012年,2012年AlexNet模 型问世开启了CNN在图像识别的应用,2015年机器识别图像的准确率首次超过人(错误率低于4%),开启了计算机视觉技术在各行各业 的应用。但是,人工智能1.0时代面临若模型碎片化,A1泛化能力不足等问题。2017年Goog1eBrain团队提出Transformer架构,奠定了 大模型领域的主流算法基础,从2018年开始大模型迅速流行,2018年谷歌团队的模型参数首次过亿,到2022年模型参数达到5400亿,模 型参数呈现指数级增长,“预训练+微调”的大模型有效解决了1.0时代A1泛化能力不足的问题。新一代A1技术有望开始全新一轮的技术 创新周期。 国信证券 GUOSENSECURITIES (NLP)任务的主流范式,该范式先利用大规模无标注数据通过自监督学习预训练语言大模型,得到基础模型,再利用下游任务的有标 注数据进行有监誉学习微调模型参数,实现下游任务的适配。在AI的1.0时代:存在模型碎片化明显、AI泛化能力不足等问题。“预训 练+微调”大模型能显著降低AI工程化门槛,预训练大模型在海量数据的学习训练后具有良好的通用性和泛化性,细分场景的应用广商能够基于大模型通过零样本、小样本学习即可获得显著的效果,使得人工智能有望构建成统一的智能底座,AI+赋能各行各业。本轮的生成式AI有望从简单的内容生成,逐步达到具有预测、决策、探索等更高的认知智能。 >OpenAI当前已选代五代模型,GPT-4开始布局多模态。OpenAI于2015年成立,微软于2019年开始与0penAI建立战略合作伙伴关系,GPT共 发布五代模型GPT-1、GPT-2、GPT-3、ChatGPT以及GPT4。GPT-1于2018年6月发布,首次将transformer与无监督的预训练技术相结合。2020年5月发布GPT-3,模型菱数量为1750亿。2022年11月,0penA1正式推出了对话交互式的ChatGPT,相比于6PT-3,ChatGPT引入了差 于人类反馈的强化学习(RLHF)技术以及奖励机制。2023年3月,OpenAI正式推出GPT-4,成为目前较先进的多模态大模型。GPT-4主要 在识别理解能力、创作写作能力、处理文本量以及自定义身份属性送代方面取得进展。 百度于2023年3月正式推出大模型文心一言。文心一言主要由文心大模型提供支持,文心一言拥有有监替精调、RLHF、提示构建、知识增强、检索增强和对话增强六大核心技术,其中前三项与ChatGPT的技术十分类似,知识增强包括知识内化和知识外用;检索增强指基于 百度搜索引擎,先对内容进行检索,再筛选出有用的部分整合输出结果;对话增强指记忆机制、上下文理解和对话规划等技术。 投资建议:建议关注基础层与应用层AI龙头。应用层建设关注:科大讯飞、金山办公、同花顺、广联达、凌志软件、彩讯股份、拓尔思福昕软件、税友股份等。基础层建议关注海光信息、浪潮信息、景嘉微等。 新务公阅设正文之后的免费声明及只项下所有内客 目录国信证券 GUOSENSECURITIE 01行业梳理:生成式AI有望带动新一轮技术创新周期 02海外玩家:OpenAI持续领先,谷歌等巨头纷纷布局 03中国玩家:百度发布文心一言,中国玩家快速追赶 04市场规模:模型参数不断增加,算力需求快速增长 05商业模式:开启订阅制收费,不断开放API接口 06应用场景:GPT走向多模态,下游应用场景不断打开 07投资建议:建议关注基础层与应用层AI龙头 后的免费声明及只项下所有内客 国信证券 GUOSENSECURITIES 1、行业梳理:生成式A1有望带动新一轮技术创新周期 请务公阅设正文之后的免费声明及只项下所右内客 1.1人工智能产业自2012年开始迎来蓬勃发展 》2012年至今属于人工智能的蓬勃发展期。人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新 国信证券 GUOSENSECURITIES 的技术科学。人工智能的发展历史大致可以被划分为5个阶段,2012年至今处于人工智能的蓬勃发展期,其分界点就是2012年前后IBM开发 的人工智能程序“沃森”参加了一档智力问答节目并战胜了两位人类冠军以及AlexNet在ImageNet竞赛中取得胜利。 以深度神经网络为代表的信息技术的发展,推动了人工智能领域的进步与拓展。2006年,Hinton等人利用单层的RBM自编码预训练使得深 层的神经网络训练得以实现;2012年,Hinton和AlexKrizhevsky设计的AlexNet神经网络模型在lmageNet竞赛中实现图像识别分类,成为 新一轮人工智能发展的起点。 神经网络发展里程标志性事件AlexNet神经网络结构 -9 2-杂营 IMAGENET 1 资料来源:CSDN、国信证券经济研完所整理资料来源:CSDN、国信证券经济研究所整理5 请务公阅设正文之后的免费声明及只项下所右内客 1.1人工智能作为第四次科技革命,已经进入2.0时代 >人工智能1.0时代(2012年-2018年):人工智能概念于1956年被提出,AI产业的第一轮爆发源自2012年,2012年AlexNet模型问世开启 了CNN在图像识别的应用,2015年机器识别图像的准确率首次超过人(错误率低于4%),开启了计算机视觉技术在各行各业的应用,带动了人工智能1.0时代的创新周期,AI+开始赋能各行各业,带动效率提升。但是,人工智能1.0时代面临着模型碎片化,AI泛化能力不 足等问题。 国信证券 GUOSENSECURITIES 人工智能2.0时代(2017年-至今):2017年GoogleBrain团队提出Transformer架构,奠定了大模型领域的主流算法基础,从2018年开 始大模型迅速流行,2018年谷歌团队的模型参数首次过亿,到2022年模型参数达到5400亿,模型参数星现指数级增长,“预训练+微调” 2022年Gartner人工智能商业化曲线人工智能有望迎来第四次科技革命 人工能 禁三次科技萍车 第二次科技革会能急技术 控 PASA SGEIMOATTEOL 139zcn SEMENS 时间 MRIIEET 1760196013607901951-20292020-米率 资料来源:Gartner国信证券经济证究所整理资料来源:SealePartner&:国信证券经济研究所整理 清务公阅设正文之后的免费声明及只项下所右内客 1.1大模型快速爆发,重新定义人工智能产业国信证券 GUOSENSECURITIES 自18年起大模型快速流行,有望重新定义人工智能产业。2018年以来,预训练语言模型(PLM)及其“预训练-微调”方法已成为自然语言处理(NLP)任务的主流范式,该范式先利用大规模无标注数据通过自监督学习预训练语言大模型,得到基础模型,再利用下游任务的有标 注数据进行有监督学习微调模型参数,实现下游任务的适配。规模越大的模型不仅在已知任务上有着更好的表现,同时展现出完成更复杂 的末知任务的强大泛化能力。 大模型示意图基础模型的“预训练一微调范式与传统深度学习区别 通用理 Tasks大数量 几+录 文本生成智能润等几7E 儿十万年 机器阳净实本生成 数用 大植型 Model MaE: (a)传晚深度学习范式(b)基础模型的“预测蓝-微调”德式 资科来:CSDN、国信证券经济研究所整理资料来源:清华大学、国信证券经济研究际整理 清务必阅设正文之后的免费声明及只项下所右内客 1.1AI工程化门槛不断降低,有望重新定义生产力国信证券 GUOSENSECURITIES AI工程化门槛不断降低,有望重新定义生产力 AI的1.0时代:存在模型碎片化明显、AI泛化能力不足等问题,导致大多数行业需要花费巨大成本来收集和标注数据,从而导致规模不经 济,而且下游场景存在诸多细分小场景,其商业化价值小、有效数据少、模型训练不足。 >AI的2.0时代:“预训练+微调”大模型能显著降低AI工程化门槛,预训练大模型在海量数据的学习训练后具有良好的通用性和泛化性, 细分场景的应用厂商能够基于大模型通过零样本、小样本学习即可获得显著的效果,使得人工智能有望构建成统一的智能底座,AI+赋能各行各业。本轮的生成式A1有望从简单的内容生成,逐步达到具有预测、决策、探索等更高的认知智能。 人工智能1.0时代与2.0时代大模型将显著降低人工智能应用门槛 单一领城数驱常:诺多数照和清多模型然成摄岛缺乏摄效;势动黑制的数标注 Al1.0 A12.0 DATASET1MODEL1ASKMODEL2 ,需肤行五花八门的旺势 WCRLDSDATAONEMODELMANYTASK: Foundation'Mode 基性模型 酒过生态温图升发者全道井花 以工典平垒为机手 以大模型为赢 资料来源:创新工场、国信证券经济研究所整理资料衰源:IDS、国信证券经济研究所整理清务必阅设正文之后的免费声明及只项下所右内客 1.2产业分类:AI产业链主要包括基础层、技术层、应用层三大层 人工智能产业链可分为基础层、技术层和应用层三大层面: 基础层:侧重基础支撑平台的搭建,包含传感器、AI芯片、数据服务和计算平台: 技术层:侧重核心技术的研发,主要包括算法模型、基础框架、通用技术; 应用层:注重产业应用发展主要包含行业解决方案服务、硬件产品和软件产品。 国信证券 GUOSENSECURITIES 应用层 技术层 人工智能产业链 行业应用金融零售医疗安防教育工业交通农业 产品应用 智能机器人 智能无人机 智能语音识别系统 智能授索系统 通用技术 自然语言处理 智能语音 机器问答 计算机规党 算法模型 机器学习 深度学习 增强学习 基础框架 传感器 分布式存储 光学传感器 分布式计算 声学传感器 神经网络 其他传感器 基础层芯片GPUFPGAASIC 计算平台数据服务数据采集数据处理 资料来速:36数标究院,国信证经济研究所整理请务公阅设正文之后的免费声明及只项下所右内客 1.2产业分类:AI模型可分为决策式AI与生成式AI 》AI模型大致可以分为决策式AI和生成式AI两种。决策式AI指学习数据中的条件概率分布,根据已有数据进行分析、判断、预测,主要应用 国信证券 GUOSENSECURITIES 分析已有数据而是学习归纳已有数据后进行演技创造,基于历史进行模仿式、缝合式创作,生成了全新的内容,也能解决判别问题。 >中国生成式AI商业应用规模迎来快速增长,预计2025年破两干亿。根据中关村大数据产业联盟发布的《中国A1数字商业展望2021-2025》 报告披露,到2025年,中国生成式AI商业应用规模将达到2070亿元,未来五年的年均增速84%。根据Gartner《2021年预测:人工智能对人 类和社会的影响》给出的积极预测,到2023年,将有20%的内容被生成式A1所创建。至2025年,预计生成式A1产生的数据将占所有数据的 10% 生成式AI应用场景2020-2025年中国生成式AI技术栈应用规模(亿元) AI摄写市场分析 2580 市场需末2002 AI撑写投放数据 分析