ChatGPT引领技术革命,通用人工智能曙光将至 从技术角度解读,ChatGPT在通用性和多模态两个层面实现了飞跃,统一了近10年来AI研究的技术路线,从而使通用人工智能(AGI)的实现有望大幅提前。其中,算力、数据和工程能力是类ChatGPT大模型研发的核心壁垒。 AI产业化:大模型为入口,关注应用环节降本增效+新增量 AI大模型作为更高效的生产力工具,以及新的互联网流量入口,其战略地位有望比拟“新一代的iOS/安卓操作系统”,重塑移动互联网时代的竞争格局,建立万亿规模的下游应用生态。其中,网文、图片、视频、游戏、电商、营销六个细分领域有望从两个方面受益于AI技术变革:一是在企业生产经营环节中降本增效,二是带来应用端的新增量。 三条投资主线:大模型、降本增效、内容资产重估 基于产业趋势,我们建议关注AIGC产业链中弹性最大的三个环节: 1)大模型:国内大模型厂商有望承接交互方式变革带来的“新增量”,参与互联网流量的“再分配”,共同受益于下一个“移动互联网”级别的增长机会,关注率先落地的大模型厂商。 2)降本增效:内容行业中降本增效最显著的是游戏,其次是音视频、图片和文字。主要系游戏数字化程度高、自有数据资源丰富、降本增效的落地速度快。此外,游戏还有望受益于AI驱动下品类创新带来的行业增量。 3)内容资产的价值重估:AIGC的核心是内容,其中文字类资产短期可作为大模型训练的优质语料库,长期基于AI多模态能力生成图片、视频、游戏的门槛依次降低,因此价值重估落地最快、空间最大。相较于图书出版,建议重点关注体量更大、娱乐性更强的网文类内容资产价值重估。 投资建议 AI大模型作为新的生产力工具和流量入口,有望引领新一轮产业变革。我们建议布局三条投资主线:1)大模型厂商,建议关注昆仑万维;2)降本增效,建议关注恺英网络;3)内容资产重估,建议关注中文在线。 风险提示:AI技术发展不及预期;监管趋严;行业竞争加剧的风险。 投资聚焦 自2022年底OpenAI发布聊天机器人ChatGPT,以及背后GPT3.5、GPT4大模型的推出,新一轮技术变革的浪潮从学术界、产业界向普通互联网用户依次破圈。我们认为类ChatGPT的AI大模型作为新的生产力工具和流量入口,有望赋能千行百业,引领新一轮产业变革。 创新之处 1)市场部分观点低估了ChatGPT作为一场技术革命的重要性和可持续性。我们通过复盘近10年人工智能发展历程,从技术角度总结了ChatGPT对于人工智能发展的三层重要意义。 2)我们基于AI大模型产业链的价值梳理,再结合AI大模型在网文、图片、视频、游戏、电商、营销六个细分领域的实际应用情况,自上而下地探讨AI浪潮中的传媒互联网投资机会。 核心结论 1)ChatGPT是人工智能技术发展的重要里程碑。其意义在于三个方面:一是统一技术路线,推动AI发展驶入“快车道”;二是功能实现飞跃,推动AI产品层面的“显性化”;三是推动AI终局预期提前,通用人工智能可见度提升。 2)AI大模型有望重塑移动互联网时代的竞争格局。其作为新的生产力工具和流量入口,有着极高的研发壁垒和落地门槛。因此,我们认为大模型厂商对于市场需求将会形成虹吸效应,相对于传统互联网大厂的竞争优势将会越发显著。 3)AI大模型生态中,最大的增长空间来自于下游的垂直应用场景:一是在企业生产经营环节中降本增效,二是带来收入端的新增量。其中游戏行业的降本增效落地最快、长期增长空间最大;网文平台基于优质的中文语料库资源,生成音频/漫画/动画等“高维”内容的门槛有望大幅降低,打开多元化变现空间。 投资建议 AI大模型作为新的生产力工具和流量入口,有望赋能千行百业,引领新一轮产业变革。基于产业趋势,我们建议关注大模型产业链中弹性最大的三个环节,布局三条投资主线:1)大模型厂商,建议关注昆仑万维;2)降本增效,建议关注恺英网络;3)内容资产重估,建议关注中文在线。 1ChatGPT引领技术革命,通用人工智能曙光将至 1.1ChatGPT破圈复盘:AI显性化的三个阶段 我们从全球产业角度,复盘AI显性化的三个阶段。自2022年底OpenAI发布聊天机器人ChatGPT,以及背后GPT3.5、GPT4大模型的推出,新一轮技术变革的浪潮从学术界、产业界向普通互联网用户依次破圈。我们将这一过程称作“AI的显性化”,主要分为三个阶段: 1)技术奇点出现。Ⅰ)22年11月ChatGPT发布:OpenAI基于GPT3.5大模型推出对话聊天工具ChatGPT,在文本生成的准确度、流畅度,长序列文本处理能力,可扩展性等多方面都显著优于以往AI模型。Ⅱ)23年3月GPT4发布:相较于GPT3.5版本,接入GPT4大模型的ChatGPT在文字对话内容的深度、广度层面均有提升;此外,除了识别文字内容,GPT4也支持图片内容的输入,多模态识别能力显著增强。 2)海外C端产品破圈。Ⅰ)ChatGPT能力初步破圈:22年11月ChatGPT发布后,用户规模5天突破100万、两个月突破1亿,在学术论文、专业考试等C端应用场景中初步破圈。23年2月微软将ChatGPT接入搜索引擎Bing,推动Bing移动端DAU单月环比增长6倍。Ⅱ)现象级应用诞生:3月微软将Office全家桶接入GPT4,发布办公助手Office365 Copilot,有望撬动全球14亿用户规模。Ⅲ)下游生态全面开启:3月27日OpenAI允许第三方开发ChatGPT Plugin插件,第一批支持的包括Expedia、Instacart、Zapier等酒旅、电商场景的头部应用。“插件”生态的放开确立了ChatGPT的流量入口地位,AI迎来“App Store时刻”,下游生态全面开启。 3)国内大厂跟进,大模型生态起步。自22年11月ChatGPT发布后,国内头部科技、互联网公司随即跟进。3月百度先后发布类ChatGPT的聊天机器人“文心一言”、企业级平台“文心千帆”,对标海外ChatGPT生态。4月阿里巴巴发布同类产品“通义千问”,华为公布“盘古”大模型进展。腾讯、字节跳动等互联网大厂也成立了专门的大模型攻坚团队,相关产品有望陆续发布。 图表1:“AI显性化”的三个阶段 1.2ChatGPT突破之处:通用人工智能的曙光 从前沿的研究和应用方向来看,AI(人工智能)主要有NLP(自然语言处理)、CV(计算机视觉)两大领域,分别聚焦于对自然语言和图像进行分析、处理。其中,ChatGPT及其背后的GPT系列模型带来的影响主要集中于NLP领域。因此,我们通过复盘过去10年NLP领域的技术发展,来解答一个关键的问题:从技术角度看,ChatGPT究竟是不是革命性的突破? 从技术角度复盘过去10年的AI发展历程,有四个重要的时间节点: 1)2017年Transformer统一NLP研究范式。谷歌在著名论文《Attention Is All You Need》中推出Transformer架构,通过引入“自注意力”机制,极大拓展了AI模型在不同任务中的可迁移性。该论文发布5年内被引用超过3.8万次,统一了NLP的研究范式,后续也被广泛跨领域应用于CV场景。 2)2018年谷歌、OpenAI路线之争:完形填空vs文本生成。2018年,谷歌、OpenAI基于Transformer框架,分别推出了AI模型BERT和GPT-1。通俗来讲,二者技术路线最主要的区别在于:预训练任务中,谷歌BERT主要使用“完形填空”的方式,即随机遮盖一些文字,让AI模型通过上下文理解进行补全;而GPT则主要使用“文本生成”的方式,即通过完全遮盖训练语料中的“下文”,训练模型基于“上文”,逐字逐句地生成文本。从应用结果来看,谷歌BERT在文本分类、关键词提取等“自然语言理解”类任务中的表现好于初代GPT。而后续随着模型参数量的指数级提升,GPT模型在翻译、写作、问答等“自然语言生成”类任务中的优势开始逐步显现。 3)2020年GPT3优势初显,千亿参数量催生“涌现”效应。2020年,OpenAI推出新的AI大模型GPT-3,其参数量高达1750亿,相较上一代GPT-2的15亿高出一百余倍。2020年后,AI大模型的“涌现”效应得到业内的广泛关注,即当参数量高于特定量级后(一般认为千亿级别是门槛),再基于模型结构、训练方法的调整,AI大模型的特定性能会出现指数级的提升,如能够准确回答未经过训练的问题。此后,谷歌、Meta等相继推出千亿参数大模型,而GPT-3的技术路径优势日益凸显。 4)2022-2023年:ChatGPT横空出世,技术路径再统一。2022年11月,OpenAI基于最新AI大模型GPT-3.5,使用来自人类反馈的强化学习(RLHF)进行精调,发布了聊天机器人ChatGPT。经过广大B端、C端用户的大规模测试,ChatGPT在文本生成场景中的通用性远超过谷歌BARD等同类应用。2023年3月,OpenAI发布GPT-4,使得ChatGPT的问答深度、广度,以及多模态识别能力进一步增强。至此,OpenAI的GPT系列已全面领先于谷歌、Meta等竞争对手,其技术路径的先进性得到充分验证。 图表2:近10年AI发展历程梳理 我们认为,ChatGPT(及其背后的GPT3.5、GPT4大模型)的推出,对于人工智能的发展具有三层重要意义: 1)统一技术路线,推动AI发展驶入“快车道”。复盘NLP发展路径可见,继2017年谷歌Transformer框架之后,NLP大模型曾分支出以谷歌BERT、OpenAI GPT为主的两大技术路径并各有拥趸。随着GPT3.5、GPT4在通用性文本生成领域的全面领先,有望再次统一LLMs(大型语言模型)的技术路径。在市场竞争的“鲶鱼效应”之下,其他AI模型厂商有望逐步迁移至类GPT的技术路径,投入的算力、人力等资源规模大幅增长,进而推动AI大模型整体的迭代速度加快、应用场景拓宽。 2)功能实现飞跃,推动AI产品层面的“显性化”。具体从功能上来看,ChatGPT在两个层面实现了较大突破:1)通用性:与此前只能应用于特定场景的AI工具不同,ChatGPT能够满足B端企业、C端生活场景中的大多数语言交互需求。2)多模态:在接入GPT-4之后,ChatGPT新增了图片输入的能力,能够识别、分析专业的数据图表和网络梗图,也能基于一张写有需求的图片生成网站源代码。ChatGPT多模态能力的初显,不仅提升了输入内容形式的自由度、提升用户体验;更为语言类大模型打开了“用图像辅助认知世界”的新通路,推动模型认知能力的进一步提升。 3)终局预期提前,推动AGI可见度提升。3月22日微软研究院发布GPT-4测评论文《AGI的火花:GPT-4早期试验》,核心观点为:鉴于GPT-4能力的广度和深度,GPT-4应该被合理视作AGI(通用人工智能)的早期版本。AGI是指具有一般人类智慧,可以执行任何人类智力任务的机器智能。此前,AGI作为人工智能研究领域的远期愿景,预计实现的时间在2050年以后。而继ChatGPT推出之后,AI大模型技术路径的统一、功能上的飞跃,推动AGI终局的可见度提升,落地预期或从2050年大幅提前。 图表3:ChatGPT对于人工智能发展的三层重要意义 因此,从技术角度看,ChatGPT(及其背后的GPT3.5、GPT4模型)在通用性和多模态层面实现飞跃,统一了NLP研究的技术路径,从而使人工智能研究的终局(AGI)预期大幅提前。进而回答本节最初的问题:从技术角度看,ChatGPT毫无疑问是革命性的突破。 1.3ChatGPT核心壁垒:算力、数据和工程能力 ChatGPT的研发主要分为预训练(Pre-train)和精调(Fine-tune)两个环节。 其中:1)预训练:使用无标注、大规模的数据集,对模型进行预训练。2)精调:让模型与专业的标注人员、AI训练师进行交互,推动模型逐步学习人类通用的表达方式和价值观,从而最终生成符合人类期望的回答 。其中又可分为有监督精调(Instr