证券研究报告|2023年05月05日 GPT已拉开AIGC技术革命序幕 海外为鉴,看国内大模型与终端应用投资机会 行业研究·海外市场专题互联网·互联网Ⅱ 投资评级:超配(维持评级) 证券分析师:谢琦021-60933157 xieqi2@guosen.com.cnS0980520080008 •海外发展:现阶段海外大模型发展领先,GPT4已呈现出色的内容生成与交互能力,Google、Meta等也已发布相关产品,预计将带来可观的增量市场与效率提升,已给相关应用(微软、彭博等)带来巨大变化,预计相似的变革也将在国内发生。 •国内大模型:国内成熟大模型落地具备较好的条件:业内已有相对成熟的方法路径(Transformer等)、大模型(GPT2、Meta-LLaMA等)及相关数据基础,而芯片短期看并未成为发展限制,百度、阿里、字节、华为、腾讯等巨头均加速布局,百度、阿里、商汤发布大模型且迭代进展迅速,预计国内GPT3级模型或在不久的将来出现,对国内产业链形成巨大影响。 •应用场景展望:考虑现阶段国内大模型未完全成熟,因此更多是借鉴海外路径演绎国内发展。目前看海外应用端已经百花齐放,办公、搜索、教育、对话社交、游戏、金融、电商、图片视频等领域已出现大量产品创新,GPTplugin插件推出后相关产品和场景有望进一步扩展。 •投资策略: •1)大模型环节:具备哪些禀赋的企业更可能在大模型竞争中脱颖而出?我们认为,大模型整体来说还是大厂的生意,综合算力资源、算法人才、数据积累及产品先发四个核心要素,目前百度领先,关注字节、阿里、华为、腾讯等企业进展。 •2)应用场景环节:具备哪些禀赋的企业能够在技术变革下守住基本盘并更上一层楼,而哪些企业可能面临被替代的风险?我们认为,有以下禀赋的企业:①原有产品场景壁垒高,且受益于AIGC出色的信息获取、内容生成能力;②有独特垂直的高质量数据;③有用户粘性与深度;④本身有较强的AI技术研发与落地能力;加持自有大模型或外部模型API有望上台阶,关注腾讯、阿里、百度,以及游戏、金融、教育、办公等垂直领域有高质量数据与场景的优质企业。反之,如无上述禀赋,或面临被大模型降维竞争风险。 •风险因素:技术进展低于预期,竞争超预期,内容、数据与技术监管风险,中美科技竞争风险 1.GPT带动AIGC技术革命,驱动海外互联网软件产业巨大变革 1)GPT的发展背景:全球AI产业厚积薄发,OpenAI技术突破 2)AIGC技术已对海外互联网软件产业链带来巨大变化 3)展望:多模态应用、GPT插件等有望带来更大的变革 2.核心变量——大模型:国内大厂加速布局,成熟大模型落地前景可期 1)从GPT看大模型的核心竞争要素:算力、算法、数据、生态 2)从中美差异看国内大模型发展路线:国内大厂加紧追赶,模型与应用齐头并进 3.应用展望:从海外路径看国内发展 1)海外应用:AIGC应用百花齐放 案例:办公写作、搜索、教育、对话社交、游戏、金融、电商、图片视频2)海外经验:“AI赋能”or“被AI替代”? 3)国内应用:有待成熟大模型落地,巨大效率提升下机遇与挑战并存国内头部互联网企业应用落地场景分析 4.投资策略与重点标的: 1)大模型及相关生态:百度领先,关注阿里、腾讯、字节、华为等 2)垂直应用领域:海外关注微软,国内关注腾讯、阿里、百度及垂直领域有高质量数据与场景的优质企业 5.风险因素:技术进展低于预期,竞争超预期,内容、数据与技术监管风险,中美科技竞争风险 •ChatGPT引发巨大关注。2022年11月30日,OpenAI推出人工智能大语言模型产品ChatGPT,能根据用户的文本输入,产生相应的智能回答,能进行多轮对话与反馈,支持各领域知识场景与多语言内容,其综合语言处理能力接近真人而处理效率显著更高,ChatGPT产品发布以来引发巨大关注,上线两个月后月活突破1亿,日活用户超1200万。 •GPT相关技术有望拉开文本信息处理的生产效率革命。语言文本处理是人类世界最重要的工作内容之一,每年全球投入大量的人员和资源用于处理各种语言文本以协调社会分工,如果AI能够协助人类大幅提升语言文本处理效率,将带来巨大的生产力效率提升。 2 ChatGPT 1亿用户达成时长(月) 消费级应用 图:消费级应用达到一亿用户花费时长 Instagram30 TikTok9 Spotify55 Pinterest41 Uber70 Telegram61 GoogleTransalte78 资料来源:Similarweb 图:ChatGPT产品功能展示 资料来源:ChatGPT •算力、数据、模型方法等底层要素的持续进步是ChatGPT发展的重要基础与驱动。 •算力提升:大规模深度学习模型的参数和数据量大幅提升,如GPT-3大模型包含1750亿参数,如果采用单片V100需要训练超过300年。而近年AI算力技术持续进步是大模型发展重要先决条件,英伟达CEO表示过去十年,通过提出新处理器、新系统、新互连、新框架和算法,并与数据科学家、AI研究人员合作开发新模型,已使大语言模型的处理速度提高100万倍(英伟达财报会议)。 •数据积累:随着数字时代的到来,生成数据的工具和软件愈发普遍,数据总量呈指数增长,可供AI训练的数据质量和数量均有很大提升,ChaGPT训练数据超过45TB。 •模型方法:GPT-1、GPT-2、GPT-3版本持续优化,迭代到GPT3.5(ChatGPT的模型)已在自然语言理解和内容生成上取得极大性能提升,后续GPT4在参数、语料与能力进一步提升。 图:GPT大模型在文字生产的出色表现,标志着生成式AI(AIGC)的巨大进步 时序记忆性:可以连续多轮对话,⼤幅提升了对 ⽤户意图的理解; 人类可纠偏:模型采用teachermodel+强化学习,主动承认错误和⽆法回答的问题,更正答案; 准确性的提升:根据《GPT-4TechnicalReport》在语言基准测评中平均准确率超过80%,在所有测试上都优于现有的LM,超过SOTA水平; 持续迭代:可以利用户数据持续训练,随着规模增长,模型性能稳定提升; 训练速度快:利用Transformer可以并行训练; 通用性:模型训练是通用的,可以适用于不同的任务; 资料来源:国信证券研究部整理,OpenAI官网,《GPT-4TechnicalReport》OpenAI 自然语言 NLP开发 (搜索引擎)文案生成 (小说/电商/新闻/法律) 对话机器人 (销售客服/情感陪伴) 机器语言代码生成代码辅助RPA交互生成 图片图片生成(toc新玩法/tob游戏、电商)图片识别 3D建模生成 音频音频识别音视频剪辑音视频生成 Avatar生成 智能控制 机器人自动驾驶边缘计算 AIforscience医学 物理化学 材料科学 安全数据安全模型安全可控生成可解释性 CconstitutionAI Gato(多模态)AlphaFold2(生物)Alphacode(代码) GPT-4(多模态)Codex(编程)CLIP(多模态)DALL-E(图片) LLaMA(语言)SAM(图片) Make-A-Video(视频) BERT(多模态)LaMDA(语言)PLaM(语言)Imagen(图片)MusicLM(音频) 算力层: 计算资源,AI芯片、云计算、通信、技术支持服务等 大模型层: 大模型以及深度学习框架 细分模型层: 专业或者垂直细分领域模型,比如金融、教育、医疗、法律等,有独特数据、场景优势的公司 终端应用层: 终端应用层,可运用与各个模态场景以及各个行业,实现AI+X •产业链角度,可分为算力层、大模型与垂直细分模型层、终端应用:1)算力层、大模型层技术门槛高、规模效应强,预计主要集中于头部公司(芯片、互联网云服务巨头);2)应用层重细分垂直行业与场景、数据,强调AI技术对细分领域的赋能提升,有望出现有更多的垂类企业机会。 1.2AIGC海外应用百花齐放、玩家众多、变化巨大 图片生成视频 文本类(文案生成、写作助手) 虚拟助手/角色 设计(营销、品牌) 代码(代码检查、代码生成) 音频类(音色模仿、音乐生成) 请务必阅读正文之后的免责声明及其项下所有内容 •插件使ChatGPT能够连接到第三方应用程序交互:3月23日,OpenAI在官网宣布推出ChatGPT插件(Plugin)功能,同时开源知识库插件源代码,从而增强ChatGPT的功能并允许执行更广泛的操作。第一批ChatGPT插件包括: ①本地生活:Expedia(旅行酒店)、KAYAK(航班、住宿和租车)、OpenTable(就餐); ②电商:FiscalNote(市场数据集)、Instacart(本地订货)、Klarna(线上比价)、Shop(购物); ③教育:Speak(学外语)、Wolfram(数学)、MiloFamilyAl(家庭教育); ④办公:Zapier(邮件、文档); •ChatGPT就能够理解如何调用、何时调用:ChatGPT调用插件只需使用者描述自己开发插件的功能,GPT可以自行调用。 资料来源:微信公众号“差评”“36氪 调用插件流程 插件一览 插件安装流程 •ChatGPT插件(Plugin)功能从开发角度类似于APPStore,越过操作系统实现生态建设,同时被下游反哺。使用角度更像微信小程序,目前不需要界面与交互过程切换(插件属性),有望形成新的流量入口。 •官方还托管了两个插件:一个web浏览器和一个代码解释器,还有用户在安装信息还发现了隐藏的后续插件功能,如: •办公:SendEmail直接通过ChatGPT发送邮件,TODO:设置和管理任务列表; •电商:CryptoPrices查询Crypto价格;娱乐:DAN可以给ChatGPT赋予个性(ChatGPT陪聊) 图:NewBing产品效果 资料来源:微信公众号“TechVerse” •开启高维信息的解读是新能力涌现的重要途经:GPT4出现多模态标志着计算机技术领域到其他领域真正的范式转变。 复杂任务 司法考试中,GPT3.5只能击败10%左右的法学生; 更可靠、更有创意,并且能够处理更细微的指令,逻辑推理能力大幅提升;各种奥林匹克竞赛、GRE考试、代码考试、统一律师考试等测试上,GPT-4可以在人类考生前10%; 在绝大多数领域(计算、逻辑、推理、批判性思维、实践)能力强于人类,在垂直细分领域达到顶级专家水平; 模态 视觉输入能力VisualInputs:理解图片、图片内容总结、图片问题回答、解释图片、图片生成代码 支持所有模态(文本、代码、图片、音频、视频)的交叉输入输出 交互性 只可以进行人类的对弈操作 GPT-4在不同风格和角色模仿上,完成度相当高。更加人性化 可以模仿任何性格特征并不被发现“冒充” 记忆性 token限制为4,096个,大约8,000个单词 可处理超过25,000字的文本。最大token数量为32,768,相当于64,000个单词 具备长期记忆性,但是懂得“遗忘”掉不重要的信息以及整合重复信息来减少资源使用 准确性 有一定事实式错误,幻觉,也就是一本正经胡说八道。 逻辑能力大幅提升,显著减少幻觉。在九类事实性评估测试中准确得分比GPT-3.5高40%: 不会胡说八道,对于模糊任务懂得引导或反驳来保证正确 安全性 GPT-4比GPT-3.5模型在有害信息的输出上少15%:与GPT-3.5相比,我们将模型响应不允许内容请求的趋势降低了82%, 不会超出在约束的边界,表现滴水不漏,但是内在黑箱的可解释性会更差 学习性 基础模型+RLHF(人工反馈强化学习) 可预测深度学习堆栈:GPT-4项目的一大重点是构建一个可预测的深度学习堆栈。使用相同的方法训练的模型进行推断,但使用的计算量为1/10000。 有目的地自主学习,会自己创造数据,参与与真实世界的交互来实践验证 扩展性 有一定的API接口 充分的API接口,开放插件