证券研究报告 AIGC行业研究框架与投资逻辑 分析师:金荣(S0010521080002) 2023年4月20日 华安证券研究所 2 投资建议 •一方面,生成式AI带来的是生产效率的提升,将大家从重复性劳动解放,生产内容更快,将更多精力放在创意等更重要的事情;同时降低用户的学习成本,吸引更多的用户来生产内容或者消费内容,也会改变与商品的交互方式,从而促成交易转化,以上两点将同时提升活跃用户数及提高市场规模,如游戏、电影、有声书、电商平台等多领域,建议关注布局大模型的阿里巴巴-SW、腾讯控股、百度集团-SW等。 •“从通用到专业?”还是“从专业到通用?”,建议在关注大模型的同时,同时关注NLP领域参数量相对较小的特定领域模型及其应用,有望通过低成本的方式加速落地,如蓝色光标、秘塔写作猫(一级项目)等;CV模型参数量通常较小,且语料库不存在中英文差异,同样值得关注,如美图公司、万兴科技、易点天下等。 •从大模型训练的角度,语料库及内容安全审查是生成式AI蓬勃发展的基石,建议关注阅文集团、中文在线、人民网、新华网、川网传媒、中国科传等。 •在语言领域,聊天对话类如电商机器人客服、互联网内容的生成、文章生成、游戏内容、游戏NPC对话等领域过去几年AI算法均有应用,大模型算法有望提供新思路,使得对话及内容生成的全局能力、角色定位、文本长度及精品度更为优质,建议关注在相关领域持续探索AI算法的公司,关注阿里巴巴-SW、京东集团-SW、焦点科技、值得买、网易-S、腾讯控股、吉比特、三七互娱、巨人网络、天娱数科等。 •在视觉领域,SAM模型产生了较大的影响力,从以前的基于卷积神经网络的纯图像特征,进阶到了利用Prompt指令去学习理解图片,大幅提高图片分割能力并且具备内容多模态理解能力。从工具侧而言,新的底层技术为其产品的可用性赋能,会使得用户使用学习成本更低,吸引更多B或者C的用户,并提升用户的留存及复购;应用侧,比如电影、动画片制作则会提高生产效率,从而生产更多优质内容,建议关注兼具IP的上海电影、光线传媒、华策影视、奥飞娱乐等。 风险提示:人工智能相关政策风险;AI模型等技术进步不及预期;用户增长不及预期等。 3 主要研究方法及相关概念 •主要研究方法:本报告主要通过对巨头厂商的大模型,以及基于Transformer模型已有应用落地的各类AI模型的盘点,以及 海外重点股权投资项目、国内一级市场及二级市场重点公司的产品及布局研究,来梳理未来应用落地的方向。 •相关概念: 深度学习(DeepLearning):深度学习(DL,DeepLearning)是机器学习(ML,MachineLearning)领域中的一个方向,相较于传统的浅层学习,深度学习的不同在于强调模型的深度以及明确特征学习的重要性。 注意力机制(AttentionMechanism):90年代提出,2014年深度学习革命,将注意力机制放到了视觉领域。其源于对人类视觉的研究。在认知科学中,由于信息处理的瓶颈,人类会选择性地关注所有信息的一部分,同时忽略其他可见的信息,上述机制通常被称为注意力机制。 Transformer模型:标志着AI发展的新阶段,具备很强的全局学习能力及很好的迁移能力,背后的原理是注意力机制。 2017年谷歌提出Attentionisallyouneed,最早的模型用在英语翻译德语的机器翻译,该模型可以让机器学习全局信息,多重记忆力模型优于此前的循环神经网络。当前Transformer模型被广泛应用,包括语言模型、图像生成、图像分类、图像分割、生物医学(alphaFold)、机器人控制(Gato控制机械臂)等众多领域。 生成式AI:生成式AI是指人工智能模型可以根据训练过的数据创建新的内容、模式或解决方案。2023年4月国家互 联网信息办公室起草的《生成式人工智能服务管理办法(征求意见稿)》向社会公开征求意见。 AGI(通用人工智能):AGI也被称为强人工智能、完全人工智能,是指智能代理理解或学习人类所能完成的任何智力任务的能力。强人工智能与弱人工智能形成对比,后者不拥有一般的认知能力,而是被设计用来解决一个确切问题的程序。 4 目录 1大模型发展历程及发展现状:科技巨头引领行业,国内大厂布局较早,众多厂商结合自身优势积极布局 2海外及国内的热门AI应用:国内自17年以来,一级市场AI+垂直赛道项目众多 3目前主流AI模型及应用解读:从文本生成辅助决策到视频生成 4国内一级市场及二级市场公司在AI领域百花齐放,有所积累 5 目录 1大模型发展历程及发展现状:科技巨头引领行业,国内大厂布局较早,众多厂商结合自身优势积极布局 2海外及国内的热门AI应用:国内自17年以来,一级市场AI+垂直赛道项目众多 3目前主流AI模型及应用解读:从文本生成辅助决策到视频生成 4国内一级市场及二级市场公司在AI领域百花齐放,有所积累 6 1.1大模型发展历程:ChatGPT引领AI迎来“奇点”,开启AGI序幕 图表1:大模型发展历程图 资料来源:CSDN,OpenAI,Google博客,量子位,机器之星,华安证券研究所整理 7 1.2海外大模型布局:科技巨头持续创新,引领行业发展方向 图表2:海外公司大模型与落地场景 模型公司 模型类型 大模型分类 技术能力 应用场景 落地产品(软件) 微软/OpenAI 多模态 GPT 2018年6月,GPT-1发布,参数量达到1.17亿个,语言泛化能力不足,无法解决通用的语言任务;2019年2月,GPT-2发布,参数量达到15亿个,舍弃模型微调,通过大模型进行预训练,开始能够解决多语言任务能力;2020年5月,GPT-3发布,参数量达到1750亿个,引入In-context训练方式学习上下文,翻译、聊天问答和文本填空等任务表现出色,能够生成难辩真假新闻的能力;2022年3月,InstructGPT发布,参数量达到5400亿个;2022年11月,推出对话式AI模型ChatGPT,由GPT-3.5大型语言模型微调而来,并引入人工反馈的强化学习(RLHF)。能够处理复杂语言工作,包括自动文本生成、自动问答、编写和调试计算机程序及创作故事;2023年3月,GPT-4发布,能够阅读文字和识别图像并生成文本结果,回复的准确性较历史版本有提升 生成、编辑和协助写作任务,例如作曲、写剧本和学习写作风格 Office、GitHubCopilot、Codex;InworldAI,多邻国、Yabble,BeMyEyes、Stripe、KhanAcademy;Salesforce,Bain&Company,Snap,Shopify;Notion、newbing;Interact、Shop、Klarna 谷歌 多模态 PaLM-E 规模最大的模型“PaLM-E-562B”具有5620亿个参数,将5400亿的PaLM和220亿的ViT集成在一起,是目前已知最大的视觉-语言模型,可用于感知推理任务、视觉语言任务和语言任务 生成文本、对话、总结书面材料、解决数学定理、预测蛋白质结构 Bard、Chrome、Gmail、GoogleWorkspace 多模态 Claude-Next 隶属于AI研究初创公司Anthropic,公司成立于2021年,创始团队大都来自OpenAI,包括前研究副总裁DarioAmodei;2023年2月Google以30亿美金投后估值投资3亿美金,合作涉及谷歌Cloud为Anthropic构建大规模GPU和TPU集群,以训练其AI系统;公司预计Claude-Next将需要10的25次方FLOPS的算力,比最大的模型还大上几个数量级。计划在18个月内投入10亿美元,公司称将比今天最大的AI还要强10倍 运用“ConstitutionalAI”的训练技术使AI与人类思维一致。成为对标ChatGPT的对话式人工智能产品 Notion、RobinAI、AssemblyAI、Peo Meta 多模态 AV-HuBERT 2023年3月发布MuAViC,是基于多语言的视听语料库,首次将视听学习应用于准语音翻译,应用于AV-HuBERT模型训练,可以进行有噪音环境下的端到端翻译;使用MuAViC情况下,AV-HuBERT模型能够结合面部特征和语音表现实现多模态输入,提升识别的准确度。在WorldErrorRate和BLEUScore评测中,Meta模型都在嘈杂环境下取得更好的表现,在清净环境下的表现与竞对一致 利用视频和视觉输入对语音进行转录,视听语音、翻译成文本 —— 亚马逊 多模态 Bloom(HuggingFace&AWS) Bloom是开源AI模型,在规模和范围上与OpenAI创建的ChatGPT模型竞争,并在AWS制造的专有人工智能芯片Trainium上运行;2022年3月,HuggingFace联合众多学者宣布Bloom1760亿参数模型开始训练;2022年5月,Bloom1.0版本诞生。6月,epoch1开始训练;2022年7月,Bloom1.3版本诞生,模型训练结束;2023年2月,亚马逊云科技宣布与HuggingFace进一步合作,加速对大语言模型和视觉模型的训练、精调和部署,促进生成式AI应用的创建 用户针对特定用例优化模型性能和降低成本以构建生成式AI应用 BLOOM、Qualtrics 资料来源:CSDN,GitHub,界面,IT之家,Google博客,MetaAI,量子位,机器之星,华安证券研究所整理 8 1.3国内大模型布局:老牌大厂AI大模型布局较早,持续进阶 图表3:国内公司大模型与落地场景 模型公司 模型类型 大模型分类 技术能力 应用场景 落地产品(软件) 标的公司 百度 文心大模型 文心大模型与飞桨共享生态,围绕“产业级”和“知识增强”两大特色,构建适合产业应用的模型体系 电力、燃气、金融、航天、传媒等领域 小度科技、度小满、百度地图、集度汽车 百度集团-SW(9888.HK) NLP 文心·NLP大模型 业界首个开放的千亿参数的中文生成API 智能创作、摘要生成、问答、语义检索、情感分析、信息抽取、文本匹配、文本纠错等各类自然语言理解和生成任务 文心一格、文心百中(网页&小程序) CV 文心·CV大模型 VIMER-CAE创新性地提出“在隐含的编码表征空间完成掩码预测任务”的预训练框架,实现图像分类、目标检测、语义分割等经典任务达到SOTA结果 图像分类、图像检测、图像分割 多模态 文心·跨模态大模型 基于知识增强的跨模态语义理解关键技术,实现跨模态检索、图文生成、图片文档的信息抽取等应用 图像生成、艺术创作、虚拟现实、AI辅助设计等 科学计算 文心·生物计算大模型 融合自监督和多任务学习,将生物领域研究对象的特性融入模型。构建面向化合物分子、蛋白分子的生物计算领域预训练模型,赋能生物医药行业 小分子药物研发 —— 文心·行业大模型 与各行业头部企业合作,在通用大模型的基础上学习行业特色数据与知识,建设行业AI基础设施 能源、金融、航天、传媒、城市、影视、制造、社科 太平洋网络(0543.HK)、财讯传媒(0205.HK)、超媒体控股(0072.HK)、掌阅科技(603533.SH)、华策影视(300133.SZ)、蓝色光标(300058.SZ)、风语筑(603466.SH);爱奇艺(IQ.O)、携程集团(9961.HK)、汽车之家(2518.HK)、能链智电(NAAS.O)、微盟集团(2013.HK) 华为 NLP 盘古NLP大模型 Encoder-Decoder架构,兼顾NLP大模型的理解和生成能力,保证模型在不同系统的兼容性。仅需少量样本和学习参数,即可完成千亿规模大模型快速微调和下游适配 智能舆论、智能营销 CV 盘古CV大模型 参数量30亿,训练数据10亿级图像,国内第一梯队,约国外2021-2022年水平 智能巡检、智慧物流 科学计算 气象大模型 借助3DEST网格结构以及分层时间聚合算法,提供秒级