数字经济系列报告 2023年08月08日 大模型风起云涌,图解AI如何赋能产业升级? 行业评级:增持 中航证券社会服务团队分析师:裴伊凡 证券执业证书号:S0640516120002 邮箱:peiyf@avicsec.com 中航证券研究所发布证券研究报告请务必阅读正文后的免责条款部分 核心观点 GPT系列引爆AI+应用 答:人工智能算法的迭代推动AIGC的发展,GPT系列属于神经AI,由2018年的GPT第1代迭代至今天的GPT-4。ChatGPT核心技术包括自然语言生成能力的大模型GPT-3.5以及训练这一模型的钥匙—— 基于人工反馈的强化学习(RLHF);现在的ChatGPT已经可以接入GPT-4,具备了多模态生成能力,且表现出人类水平的推理能力。 AIGC如何重构内容生产力? 答:AIGC模型有望成为自动化内容生产的“工厂”和“流水线”。AIGC可分为音频生成、文本生成、图像生成、视频生成及图像、视频、文本间的跨模态生成,细分场景众多,跨模态生成是未来重点发展趋势。随着底层大模型不断对外开放,行业生态日益完善,AIGC加速渗透到千行百业,根据量子位智库测算,2030年我国AIGC市场规模有望超万亿。 投资建议(AI+应用投资方向): 答:人工智能奇点将近,引爆AIGC商业变现。GPT产品的更迭标志着人工智能进入了新的发展阶段,模型技术、参数、训练数据、训练方法的演化融合方面取得了实质突破,促进数字内容供给的繁荣发展,加速推进AIGC商业化进程,掀起“用户-数据-效果”的飞轮效应。随着GPT逐渐从主题炒作阶段转向产品落地阶段,从纯技术衍生的轻量工具产品转向有具体落地场景的深度产品,有望在游戏、虚拟人、办公、电商、影视传媒等数字化程度高、内容需求丰富的行业率先商业化落地,行业内赢家将展露头角。 •游戏:“游戏+AI”带来整个行业的“降本增效”,颠覆全产业链环节。①开发端,AI可以协助开发人员快速完成基础代码;②美术端,AI可以实现快速出图、建模,节省了原画师作画的时间;③用户端,升级用户体验,吸引更多用户群体,建议关注昆仑万维/恺英网络/三七互娱/宝通科技/汤姆猫/巨人网络。 •电商:随着生成式AI技术的不断革新,结合虚拟人/大数据/虚拟现实等技术带来产业链升级,推动电商行业数字化转型进程加速,一方面,AI赋能仓储、发货、物流等订单管理环节,为电商企业降本 增效,另一方面,AI在智能客服、选品和数据训练等方面能够为用户提供更高效的购物决策体验,建议关注小商品城/华凯易佰/吉宏股份/值得买/遥望科技。 •办公:随着GPT系列的破圈,AI生成图片/视频/音频/代码等工具应用加速涌现,全力提升用户创作效率,建议关注万兴科技/金山办公/泛微网络。 •影视:影视行业对内容质量要求较高,而AI是内容行业“最强辅助”,助力剧本创作、虚拟场景搭建、创意模拟、后期制作等环节实现降本增效,同时虚拟人、虚拟现实等技术能为影视行业带来全新的生产方式和沉浸式观影体验,推进产业精品化&工业化趋势,建议关注上海电影/光线传媒/人民网/新华网。 •教育:AI技术与教育的结合具有天然的应用场景,利用人工智能、虚拟现实、AIGC等技术手段融入到教学过程中,能够大幅提升老师和学生的互动效率,弥补优质教育教学资源不足的状况,建议关注南方传媒/创业黑马/世纪天鸿/盛通股份/佳发教育。 •营销:AI技术可以赋能营销的各个环节降本增效,从用户洞察、精准推荐、内容创意、效果评估到传播增效等客户获取阶段全流程,为企业提供了更高效、更精准的营销方式,提高获客效率,建议关注蓝色光标/浙文互联/三人行/风语筑/易点天下。 •数据要素:土地、劳动力、资本等传统要素对经济增长的拉动作用边际减弱,数据要素对经济增长/GDP的引擎作用日益凸显,未来数据确权、交易和流通等环节是突破的重点,建议关注人民网/浙数文化/美亚柏科。 •虚拟人:AI有效提升虚拟人的生产效率,降低虚拟人制作及运营成本,赋予虚拟人灵魂内核,拓展应用边界,当前已有数字分身、情感陪伴、短视频营销、智能客服、广告代言等多场景落地,AIGC带来更加智能化、个性化的交互体验,大大提升用户体验及互动感,建议关注天娱数科/捷成股份。 •IP:AI技术带来IP的价值重估,IP作为大模型数据训练的语料,优质IP保障更加高效率和高质量的内容输出,IP版权方受益于大模型开发的海量需求,此外中文语料的自主可控也不容忽视,建议关注中 文在线/中国科传/掌阅科技/奥飞娱乐/中文传媒/视觉中国/果麦文化。 资料来源:中航证券研究所整理 1GPT系列引爆AI+应用 2大模型开启AI新时代,产业化应用提质增效 目录 3投资建议:AI+应用拐点将至,关注场景落地节奏 4风险提示 人工智能算法的迭代推动AIGC的发展:几十年来,AI领域持续探索,1940-1980s符号AI占主导,1980年后,统计AI与神经AI齐头并进,二者竞争发展至今,GPT系列属于神经AI。符号(Symbolic)AI:二十世纪80年代以前属于符号AI时代,开启了以知识建模算法、专家系统算法为代表AI早期发展阶段;统计(Statistical)AI:1985年的贝叶斯网络和1995年的SVM是20世纪机器学习发展的两大标志,但近年来,逐渐成为非主流的研究方向;神经(Neural)AI:经历了1980s-2012年神经网络、2012年后的深度学习两大阶段,深度神经网络和模型大小呈正相关,伴随着模型参数量的增加,相对应深度神经网络的能力将 大幅提升,GoogleBrain的Transformer和OpenAI的GPT系列都属于深度学习领域的代表作。 SymbolicAI •将人类专家的知识和经验转化为计算机可以理解的形式,并利用AI技术来实现 •手写规则,简单粗暴 •只能处理非常少量数据 •像人脑一样学习 •开始尝试大量数据 •提前标注数据 •应用于计算机视觉、自然语言 处理、语音识别等领域 1985至今1980s-20122017 GPT系列 •基于Transformer架构 •投喂海量学习数据 •无监督训练方法 •通用文本预训练 2018 1970-1980s •找到一些函数或参数 •分类固定量数据 •应用于数据分析、预测和分类等任务 机器学习 StatisticalAI •全注意力机制 •关注文本序列数据 整体注意力 Transformer 知识建模、专家系统 图表1:ChatGPT的应用举例 神经网络 NeuralAI 神经人工智能 深度学习 PGC UGC AI-AssistedGC AIGC 规模 小 大 较大 大 质量 高 低 较高 高 特点 专业质量有保证 自由上传内容丰富 质量提升丰富度提升 高效率 互联网内容生产方式经历了PGC、UGC、AIGC的过程,AIGC是一种利用人工智能技术自动生成内容的新型生产方式。 PGC(ProfessionallyGeneratedContent)是专业生产内容,如Web1.0和广电行业中专业人员生产的文字和视频,其特点是专业、内容质量有保证。 UGC(UserGeneratedContent)是用户生产内容,伴随Web2.0概念而产生,特点是用户可以自由上传内容,内容丰富,但质量良莠不齐。 AIGC(AIGeneratedContent)是由AI生成的内容,其特点是自动化生产、高效,规模、质量都能得到保障,预示着Web3.0时代已经到来。 Web1.0(1991-2004) 以搜索为核心 门户网站/图文时代 中心化 阅读式互联网 “可读” (read) Web2.0(2004至今) 个人内容互动 社交媒体/电商时代中心化 可读可写互联网 “可读+可写” (read+write) Web3.0 (2014年概念提出) 数据内容互动智慧网络时代去中心化 可获价值互联网 “可读+可写+拥有” (read+write+own) ? $7.3trillion $1.1trillion 图表2:内容创作模式的四个发展阶段对比图表3:AIGC产业生态初步形成 PGC 专业生产 UGC 用户生产 AIGC AI生产 1.2AIGC产业链日益成熟,商业价值加速释放 AI技术逐渐实现从分析到创造的迭代,AIGC产业生态体系雏形已经显现,呈现为上中下三层架构。 ①上游基础层,即由预训练模型为基础搭建的AIGC技术基础设施层,如相关算法/模型研究结构; ②中间层模型,即垂直化、场景化、个性化的模型和应用工具,在预训练的大模型基础上微调,实现在不同行业、垂直领域、功能场景的工业流水线式部署; ③下游应用层,即面向C端用户的文字、图片、音视频等内容生成服务,包括网页、本地安装的程序、移动端小程序、群聊机器人等。 产业链 上游 产业链中游 产业链 下游 图表4:AIGC产业生态体系的三层架构 基础层:预训练模型 中间层:垂直化、场景化、个性化模型 应用层:语言和文字生成等AIGC应用 1.3AI大模型竞相绽放,加快赋能多场景应用 创新生成算法+预训练模型+多模态技术,驱动AIGC技术变革。GAN为早期最著名的生成模型,随后Transformer、基于流的生成模型、扩散模型相机涌现,而预训练模型引发了AIGC技术能力的质变,多模态技术推动了AIGC的内容多样性。 AI三大核心要素是数据、算力和算法。数据是AI算法的“饲料”,AI算法需要通过数据训练不断完善,而数据标注是大部分AI算法得以有效运行的关键环节;算法是AI的背后“推手”,主流的算法主要分为传统的机器学习算法和神经网络算法,目前神经网络算法因为深度学习的快速发展而达到了高潮;算力是算法和数据的基础设施,支撑着算法和数据,算力的大小代表着对数据处理能力的强弱,进而影响着AI的发展。 图表5:AIGC产业的技术驱动 基础的生成算法模型生成算法模型不断创新 •GAN(生成对抗网络)是早期最为著名的生成模型,后来产生了许多流行的架构或变种 •涌现Transformer、DiffusionModel等深度学习的生成算法 预训练模型(大模型)引发AIGC技术的质变 •AI预训练模型,又称为大模型、基础模型 •基于大量数据训练的、拥有巨量参数的模型 •多任务、多语言、多方式,适应广泛的下游任务 多模态技术 推动AIGC内容多样性 •图像、声音、语言等融合的机器学习 •不同模态数据间的转化与生产 计算机视觉(CV)预训练模型 •用于生成新的图像或视频 •微软的Florence 多模态预训练模型 •融合文字、图片、音视频等多种内容形式 自然语言处理(NLP)预训练模型 •生成式AI可以用于生成新的文本、回答问题、语言翻译和对话系统等任务 •谷歌的LaMDA和PaLM、OpenAI的GPT 三大核心要素 AI算法的“饲料” 语音、文本、视频等 AI的背后“推手” 神经网络、深度学习等 AI时代的基础设施 计算机、芯片等 算力 算法 数据 AIGC 1GPT系列引爆AI+应用 2大模型开启AI新时代,产业化应用提质增效 目录 3投资建议:AI+应用拐点将至,关注场景落地节奏 4风险提示 随着AI技术加速迭代,国内虚拟人市场规模呈现强势增长态势。据艾媒咨询数据显示,2022年中国虚拟人带动产业市场规模和核心市场规模预测值分别为1866.1亿元和120.8亿元,呈现强劲的增长态势。随着数字化娱乐场景需求的增加,AI等技术不断迭代的环境下,中国虚拟人产业化应用提速升级。 乘风AI大模型的涌现,虚拟数字人加速释放多元商业价值。数字人制造和运营服务的B端市场不断扩大,将面向更广大的C端用户提供服务,深耕数字人相关业务的企业有望迎来黄金发展期,加速释放生产效能,天娱数科、天地在线、蓝色光标等公司已推出数字人解决方案,应用场景不断延伸。 2000 1800 1600 1400 1200 图表6:2017-2022