您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国信证券]:AIGC行业快评:GPT-4、文心一言陆续发布,场景落地逐步成为AIGC产业核心 - 发现报告
当前位置:首页/行业研究/报告详情/

AIGC行业快评:GPT-4、文心一言陆续发布,场景落地逐步成为AIGC产业核心

文化传媒2023-03-17夏妍、张衡国信证券喵***
AIGC行业快评:GPT-4、文心一言陆续发布,场景落地逐步成为AIGC产业核心

事项: 1)3 月 16 日下午 2 点,百度于北京总部召开新闻发布会,主题围绕新一代大语言模型、生成式 AI 产品文心一言。百度创始人、董事长兼首席执行官李彦宏出席及百度首席技术官王海峰出席,并展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。 2)3 月 15 日凌晨 1 点,OpenAI 发布了期待已久的 GPT-4。GPT-4 相比以往版本的最大变化是跨模态、长内容的解决能力,同时 GPT-4 具有更广泛的通识知识和问题解决能力,可以更有效的解决难题。 国信传媒观点:1)GPT-4 主要亮点在多模态和长内容解决能力,文心一言国产大模型终于问世,二者背后本质是生成式 AI 的确定性产业趋势,技术底座夯实之下,应用场景将迎来实质性变革;2)多家 A 股传媒上市公司宣布接入百度文心一言,具体来看,有望在虚拟人、文本生产、虚拟空间、交互对话、内容宣发、数字营销等场景开展探索布局;3)从单一模态到多模态,GPT-4 有望真正带来内容端、平台端的重估。微软 GTP4、谷歌 PaLM-E 类跨模态模型可以处理更复杂的任务,使得通用大模型逐渐成为可能。除此以外,我们看到了预训练大模型成本可控及轻量化运行的趋势,这使得“通用大模型”+“垂直小模型”有望落地至具体场景,基于此诞生的类“内容大脑”的操作系统,让 AI 时代的新物种成为可能。 从生产力到商业化应用,基于科技及产业视角聚焦传媒互联网关键环节核心标的,建议关注:1)数据要素及 IP 角度推荐中文在线(文学 IP 及内容数据与平台)、掌阅科技(文学 IP 及内容数据与平台)、视觉中国(图片素材)、中国科传(科技文献资源)、浙数文化(数据要素及交易平台、云计算服务等)、人民网(数据确权及内容审核)、新华网(数据确权及 AIGC 算法平台)等标的;2)场景落地关注文学、音乐、数字人、营销服务、电商、视频、游戏等领域,推荐汤姆猫(人机对话游戏场景落地)、昆仑万维(算法工具、AIGC 在浏览器、游戏、社交等场景落地)、蓝色光标(数字人&营销服务)、天娱数科(ChatGPT+数字人)、三人行(营销场景)、哔哩哔哩(UGC、PUGC 内容平台)、芒果超媒(在线视频)、恺英网络(游戏开发及 NPC 对话等场景)、宝通科技(VR/AR 场景)等标的。 风险提示:国内内容监管问题无法接入 ChatGPT;应用场景产品落地不及预期;预训练大模型成本高昂,企业需求端尚不明晰;国产大模型效果低于预期。 评论: 百度:“文心一言”正式发布,关注其应用生态接入进展 3 月 16 日下午 2 时百度在北京总部召开发布会,主题围绕新一代大预言模型、生成式 AI 产品文心一言。 百度创始人、董事长兼首席执行官李彦宏出席及百度首席技术官王海峰出席,并展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。 图1:百度发布会展示文心一言五个使用场景中的综合能力 具体来看: 1)文学创作:发布会上李彦宏通过与文心一言围绕《三体》的 6 轮连续对话展示了文心一言对事实性问题的检索回答能力、总结分析能力和推理能力。关于事实性问题回答的正确率方面,文心一言采用了知识增强和检索增强,通过 5500 亿实时数据训练,可以保证事实性的回答能够比较准确。 2)商业文案创作:通过三轮连续问答,文心一言完成了为公司起名、生成 Slogan 和生成公司成立的新闻稿三项任务,展现大模型的理解能力、表达能力和创意创作能力。 3)数理逻辑推算:可解决鸡兔同笼问题,在两轮鸡兔同笼问题中文心一言能够识别问题提得对不对,并展现解题推理步骤提供正确答案。 4)中文理解:文心一言具备领先的对中文和中国文化的理解能力,可以解释“洛阳纸贵”的意思、其中的经济学原理,并用“洛阳纸贵”写了一首藏头诗。 5)多模态生成:在四轮问题交互中,文心一言完成通过文字生成图片、回答相关问题、用方言生成音频和用这些内容生成视频的任务。当前除了视频生成功能由于计算成本较高暂未开放,其他功能已向文心一言的用户开放。 图2:文心一言的界面 图3:与文心一言围绕《三体》的提问 图4:文心一言完成为公司起名任务 图5:文心一言解决两轮鸡兔同笼问题 图6:文心一言用“洛阳纸贵”作藏头诗 图7:文心一言通过文字生成图片海报 从技术栈上看,AI 时代技术栈有四层,分别为芯片层、框架层模型层和应用层。文心一言、文心一格都是属于模型层,文心是百度模型的一个品牌。AI 时代的应用譬如搜索、聊天和其他的应用会基于这些大模型来进行开发。文心一言定位为一个通用的基础模型,未来大模型或扩散拓展为“通用大模型”+“垂直小模型”,产生譬如能源模型、交通模型、媒体模型等“垂直小模型”实现场景落地。 文心一言发布会提出三方面的机会:1)新型的云计算,云计算的商业模式由 IaaS 变为 MaaS(Model as a Service),应用或建立在大模型上而不是云算力或云储存上;2)行业模型的调精,行业将其数据、理解和知识与大模型相结合产生中间层的行业大模型,通过各个行业的模型的精调实用性更强;3)应用开发,在大模型基础服务之上产生的具有文字生成、图像生成、音频生成,以及数字人等能力的现象级新应用和新产品。从 2 月 7 日百度官宣发布文心一言,至今已有 650 家企业宣布接入文心一言生态。 图8:AI 时代的四层技术栈 图9:百度认为大模型的三大产业机会 微软:多模态 GPT-4 来袭,AIGC 的应用场景端有望真正打开 3 月 15 日凌晨 1 点,OpenAI 发布了全网期待已久的 GPT-4。GPT-4 的最大变化是跨模态、长内容的解决能力。同时 GPT-4 具有更广泛的通识知识和问题解决能力,可以更有效的解决难题。 图10:OpenAI 发布跨模态大模型 GPT-4 相比前一代 GPT,GPT-4 的优势体现在: 1)更有创造力:GPT-4 更具创造性和协作性,可以与用户一起生成、编辑和迭代创意和技术写作任务,例如创作歌曲、编写剧本或学习用户的写作风格。 2)视觉输入:GPT-4 可以接受图像作为输入并生成说明、分类和分析。GPT-4 可以看图说话,并并分析图表。 3)处理更长的上下文:GPT-4 能够处理超过 25,000 个单词的文本,允许使用长格式内容创建、扩展对话以及文档搜索和分析等用例。GPT-4 的高级推理能力超越了 ChatGPT,处理复杂任务时 GPT-4 更可靠、更有创造力,并能够处理比较微妙的指令。 图11:GPT-4 对文本交互的精准度和创造性进一步提升 图12:GPT-4 能够理解图片中的逻辑 图13:GPT-4 可处理复杂推理任务 图14:OpenAI 公布 GPT-4 可在考试中超过 90%的人类 基于 GPT-4,OpenAI 官方给了几款加入了 GPT-4 的产品应用,涉及教育、公益、金融等领域。 1)Duolingo:一款语言学习类 APP,Duolingo 把 GPT-4 接入产品,进行角色扮演,让人工智能跟用户去对话,纠正语法错误,并且把这一功能融入产品的游戏化;2)Be My Eyes:一款为视力障碍人士提供的产品,大部分的盲人类产品都只能识别文字,现在可以借助 GPT-4 的图像识别分析来看世界;3)摩根士丹利:摩根士丹利的内容库包含数十万页的知识,涵盖投资策略、市场研究和评论以及分析师见解,借助GPT-4 改变其财富管理人员查找相关信息的方式;4)可汗学院是一家非营利组织,其使命是为任何地方的任何人提供免费的世界一流教育。该组织为所有年龄段的学生提供数以千计的数学、科学和人文课程宣布将使用 GPT-4 为 Khanmigo 提供支持,Khanmigo 是一种人工智能助手,既可以作为学生的虚拟导师,也可以作为教师的课堂助手。 图15:Duolingo 接入 GPT-4 图16:Be My Eyes 接入 GPT-4 图17:摩根士丹利接入 GPT-4 图18:可汗学院接入 GPT-4 大模型不断升级,海外到中国,生成式 AI 浪潮已来 从中国本土化大模型来看,目前国内大模型处于投入期,除了互联网巨头,还有科研机构等三方不断投入预训练大模型。相对而言看,百度在 AI 领域的长期持续投入,1)ChatGPT 仍有内容监管漏洞,接入国内自己的大模型更加自主可控;2)从微软当前动态来看,ChatGPT 仍未对中国用户开放注册,同时微软宣称将允许其他公司依据 ChatGPT 创建定制版本的模型,但仍未宣布具体时间表及实现路径;3)从百度的技术路径上看,百度在 AI 方面布局早,预训练大模型技术积累深,拥有海量中文自然语言数据,从数据上或更贴合中文自然语言模型的应用落地。 表1:国内预训练大模型梳理 目前已有多家 A 股传媒上市公司宣布接入百度文心一言,具体来看,有望在虚拟人、文本生产、虚拟空间、交互对话、内容宣发、数字营销等场景开展探索布局。 表2:传媒上市公司计划接入“文心一言”梳理 从海外市场来看,ChatGPT 3.5 引发了市场轰动、变革商业场景,GPT-4 之前的模型更多是基于语言语义文本,而 GPT-4 的出现真正夯实了 AIGC 的算法底座。1)文本、图片、音频、视频等多维度内容都可以实现生成、交互,GPT-4 有望真正带来内容端、平台端的重估。微软 GTP4、谷歌 PaLM-E 类似这些跨模态模型可以处理更复杂的任务,使得使得通用大模型逐渐成为可能;2)除此以外,我们看到了预训练大模型成本可控及轻量化运行的趋势,这使得“通用大模型”+“垂直小模型”有望落地至具体场景,基于此诞生的类“内容大脑”的操作系统,让 AI 时代的新物种诞生成为可能;3)GPT 有望率先改造 B 端市场。相对而言海外在 B 端的付费意愿强于中国,而 C 端市场的改造类似于搭建内容生产的“AI 操作系统”,其成立条件一方面需要待多模态大模型落地,另一方面从全球市场来看,尚未看到 To C 级别的“GPT+”应用。 表3:海内外科技公司多模态模型布局 行(营销场景)、蓝色光标(数字人&营销服务)、哔哩哔哩(UGC、PUGC 内容平台)、芒果超媒(在线视频)、恺英网络(游戏开发及 NPC 对话等场景)等标的。 表4:重点公司估值表