证券研究报告 2023年4月16日 行业:传媒 增持 AIGC系列专题:国外AIGC各模态产品梳理 ——应用篇(一) 分析师:陈旻SAC编号:S0870522020001 我们AIGC系列专题《“大模型+小样本”快速适配下游场景,“AI+传媒”的效力取决于适配与迭代》将“AI+传媒”的研究框架定义为“通用大模型”+“行业小样本”的技术架构。“AI+传媒”在应用层表现效力优劣的关键取决于通用大模型对垂直应用的适配程度及迭代速度,更进一步理解: 1、“行业小样本”的数据集来自小模型或应用及内容:AI产业链包括上层大模型、中层小模型、下层应用及内容,包括应用及内容直接接入大模型或通过小模型接入大模型两种方式,即“大模型+应用及内容”或“大模型+小模型+应用或内容”,其中具备特定功能的AIGC软件产品我们理解为“小模型”+“应用”的技术范式,本身具备较高质量的AI能力,若接入匹配的多 模态大模型,有望实现能力上的质变突破。 2、“行业小样本”的结合方式包括“能力调用”及“能力训练”两层: (1)“能力调用”是指下游垂类场景直接调用通用大模型的通用能力,并基于垂类场景内产生的特性化数据不断提升调用能力在垂类场景内的适配程度。我们认为现阶段下游应用及内容主要采取此类方式接入大模型能力,此类方式可高效快速调用大模型先进能力,在时间上及成本上具备优势。 (2)“能力训练”是指下游垂类场景将通用大模型针对特性化数据集进行再训练,从而形成垂类场景专属大模型。例如彭博社利用自身丰富的金融数据源,基于开源的GPT-3框架再训练,开发出了金融专属大模型BloombergGPT。我们认为未来拥有丰富特性化数据集的下游垂类场景将主要采取此类方式,有助于构筑更强的能力壁垒。 围绕我们对“AI+传媒”的研究框架体系,我们后续分别针对“技术层”及“产品/应用层”梳理AIGC研究版图,本篇属于AIGC系列专题中“AIGC应用篇系列之一”,重点梳理国外多模态头部应用产品,本篇主要整理国外文本类头部AIGC产品。 我们将国外主要AIGC头部产品按照文本、图像、音频、视频分类如下: 文本领域:AutomatedInsights(结构化写作)、Anyword、Copy.ai(数字广告文案)、Jasperai(营销文案AI)、ChatGPT(通用类聊天机器人)、ChatBox(聊天客服机器人)、Jenni.ai(论文AI) 图像领域:Midjourney(2C端文生图AI)、DALL-E2、StableDiffusion(2B端开源高质量文生图模型) 音频领域:MurfAI(文本转语音生成器)、AIVA(歌曲生成) 视频领域:Synthesia(拼凑生成视频)、WonderStudio、RunwayGen-2(视频生成模型) 我们认为“通用大模型”+“行业小样本”是未来主流AI发展范式。我们理解AI大模型是一种新型平台模式,是移动互联网向沉浸互联网发展的中间形态。从平台的逻辑出发,AI产业链包括上层大模型、中层小模型、下层应用及内容,包括应用及内容直接接入大模型或通过小模型接入大模型两种方式。我们认为国外头部AIGC应用产品属于“小模型”+“应用”的技术范式,本身具备较高质量的AI能力,若接入匹配的多模态大模型,有望实现能力上的质变突破。一方面上层大模型持续为小模型、应用及内容赋予通用型能力,其兼容性取决于大模型的输出与小模型/应用及内容的输入在模态上是否匹配;另一方面小模型、应用及内容持续产生的大数据可不断迭代大模型的通用能力,并让大模型更为适配垂类场景。参照PC互联网、移动互联网,我们认为每一轮新型平台模式的兴起均会重新划分流量竞争格局,涉及巨大市场空间的重新分配,且我们预计本轮AI大模型有望同时变革B端及C端产业。因此我们认为在上层大模型竞争格局尚未稳定的初期,大模型为争抢更多中下层数据入口,有望大幅让利。中下层的小模型、应用及内容有望百花齐放,且最先深度结合先进大模型的应用有望收获较大增量红利。 我们认为AIGC可分为技术方(直接收益)及场景/应用方(直接&间接收益)两类,前者为AIGC相关技术直接研发及相关上下游(如算力),变现模式预计包括会员付费、广告变现、B端变现等(如技术授权/服务/运维等);后者为AIGC技术与落地场景深度融合,场景/应用方利用AIGC技术获得直接收益或间接收益:(1)直接收益对应收入弹性,对应市场空间的增量;(2)间接收益对应利润弹性,对应利润率的提高。目前GPT-4输出模态主要为文字,我们认为现阶段传媒领域最高效的结合场景为“AI+虚拟人”,其中具备IP价值的虚拟人受益更为明确。 风险提示:宏观经济风险,地缘政治风险;技术发展不及预期;AIGC行业发展不及预期等。 目录 SECTION Content 一、文本领域二、投资建议三、风险提示 一、文本领域 1.1应用型文本生成 文本生成类应用可具体分为应用型文本生成、创作型文本生成、交互型文本生成和文本辅助生成四类产品。 由于NLP生成的技术发展相对较久,目前国外各个赛道均有相应公司布局。 应用型文本生成大多为结构化写作,在过往NLP公司中发展成熟,以新闻撰写等为核心场景。主要公司包括AutomatedInsights(美联社Wordsmith)、NarrativeScience、textengine.io、AXSemantics、Yseop、Arria、retresco、Viable、澜舟科技等。 图1:我国AIGC产业不同模态赛道发展预测 资料来源:量子位智库,上海证券研究所 从数据中生成清晰文本,Wordsmith使数据驱动型组织更好作出业务决策。Wordsmith是一个自助式自然语言生成平台,AutomatedInsights是Wordsmith的创建者。Wordsmith使公司能够以前所未有的速度和规模将数据转换为富有洞察力的叙述,并且能够实现实时分析、可定制、易于扩展、随处发布。 图2:Wordsmith为各行各业数据驱动型组织提供支持 资料来源:AutomatedInsights,上海证券研究所 AI重新定义新闻生产,自动化创作比手动工作效率提升近15倍。在使用Wordsmith之前,美联社的记者几乎没有时间专注于硬新闻报道,而是每个季度花费大量时间制作财务报告。在此期间,美联社每季度只能制作300份财务报告,还有数千份潜在的公司收益报告未成文。与财经记者类似,体育记者只有时间报道每个联盟的顶级球队,无法报道未排名的比赛。美联社从AutomatedInsights的Wordsmith平台找到了自动化的解决方案 。就财务报告而言,Wordsmith在几秒钟内将收益数据转换为可发布的美联社故事。美联社现在制作了4400个季度收益故事,比其手动工作增加了近15倍。 数据驱动型报道的自动化使记者能够专注于撰写批判性的定性文章。为了支持体育记者,美联社在2018赛季开始自动化报道NCAA一级男子篮球比赛,使用Wordsmith和StatsPerform的数据为常规赛提供超过5000个预览。数据驱动型报道的自动化使记者能够专注于撰写批判性的定性文章,减少对数字的关注。实际上,自动化并没有取代任何记者,而是释放了每个季度制作收益报告所花费的约20%的时间,相当于释放了整个组织的 三名全职员工。 图3:Wordsmith的核心客户涵盖美联社、雅虎体育、韦坎普等 资料来源:AutomatedInsights,上海证券研究所 1.2创作型文本生成 1.2.1Anyword:数据驱动AI文案平台 创作型文本生成:主要适用于剧情续写、营销文本等细分场景,具有更高的文本开放度和自由度,目前在语 义层次、长文本通顺上还有较大的提升空间。该领域代表性公司包括Anyword、Copy.ai、Jasperai等。 为企业蓬勃发展提供数据驱动型解决方案,助力营销方案改进,提升广告ROAS。Anyword是YanivMakeover和AdamHabari于2013年创立的一种AI写作工具,旨在改变用户的文案写作习惯。根据Anyword官方 统计,使用Anyword的营销人员的转化率平均提升了30%,Facebook,Linkedin,Google和原生广告的ROAS提 高了15-30%。据官网显示,Anyword共有16种产品矩阵,能够适应多种应用场景,为营销赋能。 图4:Anyword的将原生广告的ROAS提升15-30%图5:Anyword的强大营销工具组合 资料来源:Anyword,上海证券研究所资料来源:Anyword,上海证券研究所 2020年PaulYacoubian创建了Copy.ai。Copy.ai是一款AI写作工具,它使用自然语言处理技术和机器学习算法,帮助用户生成高质量的文本内容。Copy.ai可以生成各种文本类型,如产品说明、博客文章、邮件、推广文案等。 实时数据更新提供更优内容,助力团队协作获得可持续增长。ChatGPT仅使用截至2021年的数据进行训练,这意味着所得到的回答都是基于两年前数据产生,而Copy.ai通过提取实时数据来提供最新的信息。Copyai目标是帮助团队协作解决更高层次的问题,从而为客户业务带来可持续增长。ChatbyCopy.ai为个人用户提供 发展所需的信息、数据和相关资源,并且永久免费。用户可以在永久免费计划中进行AI驱动的工作流程。如果用户想升级,将被收取每月49美元的统一费用用以无限制访问。 图6:Copy.ai专为团队协同打造 资料来源:Copy.ai,上海证券研究所 JasperAI是一个面向企业的生成式AI平台,能够快速为企业定制专属内容。JasperAI能够帮助制作高转化率 的营销文案,并且能够拓展用户所输入的内容,同时,该平台支持读写26种语言。 助力突破协作障碍,重新包装所写内容。Jasper由DaveRogenmoser、ChrisHull和JohnPhilipMorgan于2021年成立。Jasper被Inc.5000公认为“美国发展最快的私营公司之一”。借助Jasper,从个人自由职业者到企业公司的创作者,任何人都可以突破创作的障碍,重新包装他们所写的内容,并将其调整为不同的格式和语言。 图7:Jasperai专为品牌语音和风格指南量身定制 资料来源:Jasperai,上海证券研究所 1.3交互型文本生成 1.3.1ChatGPT:OpenAI旗下通用型聊天机器人 交互型文本生成是指AI和使用者持续就某一话题/服务,或是完全发散式的进行聊天,典型场景是智能客服/聊 天机器人/虚拟伴侣/游戏中的NPC个性化交互等。该领域国外代表公司有OpenAI、HiddenDoor、ChatBot等 。 ChatGPT由GPT-3.5系列中的模型微调而成,以对话形式进行交互,基于指令提供详细答复。ChatGPT是OpenAI在2022年11月30日推出的人工智能应用,在AzureAI超级计算基础架构上进行训练,于2022年初完成训练 。ChatGPT由GPT-3.5系列模型微调而成,是一种专注于对话生成的语言模型,以对话方式进行交互。对话形 式使ChatGPT能够回答后续问题、承认错误、挑战不正确的前提并拒绝不适当的请求。 图8:ChatGPT以对话形式进行交互基于指令提供详细答复 资料来源:OpenAI,上海证券研究所 语言能力出色适配各类交流语境,助力工作提质增效。ChatGPT具备出色的语言能力,有效提高工作效率, 具体体现在以下几个方面:1)适配交流语境。ChatGPT能够在具体情况中运用常识,并且适配交流语境;2 )具备丰富语料库。ChatGPT词汇量丰富,可以进行不同难度的写作,能以指定的方式,在保留语义的前提 下修改措辞,出色地修改文本的形式、内容和风格进行修改。同时能够管理多语言术语,有大型语料库,能够很好地遵循术语要求;3)识别冒犯性内容。ChatGPT能够识别冒犯性内容