行业研究 报计算机 告 人工智能进入GPT-4时代,应用场景有望加速落地 2023-03-19 行业周报看好/维持计算机 22/7/21 22/9/21 22/11/21 23/1/21 走势对比 报告摘要 10% 太 3% 22/3/21 22/5/21 平 (5%) (12%) 洋(19%) 证(26%) 券股份有限公司证券研究报 告 计算机沪深300 GPT-4与文心一言两大模型发布,人工智能迎来历史性时刻。 1)3月15日凌晨,OpenAI发布多模态预训练大模型GPT-4。GPT-4多个方面实现了飞跃式提升,如文字输入限制提升至2.5万字,在各类测试中的表现优于GPT-3.5,相较于现有的多种用英语编写的机器学习,GPT-4其他语言能力也很强。更重要的是,GPT-4可以接受文本、图像等多种形式的输入,多模态成为其一大亮点。 2)3月16日,百度文心一言正式发布。百度投入AI已经十几年,2019年推出文心大模型不断迭代。文心一言大模型具备文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成五 大能力。背后是百度从芯片层(昆仑芯)、框架层(飞桨)、模型层(文心大模型)、应用层(C端应用、B端应用)的全栈人工智能技术。 大模型的应用价值更值得期待。 1)微软发布Microsoft365Copilot,办公进入智能化时代。Copilot由OpenAI的最新一代大型语言模型GPT-4驱动。以聊天机器 证券分析师:曹佩 E-MAIL:caopeisz@tpyzq.com 执业资格证书编码:S1190520080001 研究助理:程漫漫 E-MAIL:chengmm@tpyzq.com 执业资格证书编码:S1190122090004 人的形式出现在侧边栏中,以强大的功能赋能office,可以实现根据日程起草Word文档、在Excel中找出最有利润的产品并进行排序以及形成可视化图表、根据新闻稿生成PPT等,极大地提高了办公效率。 2)百度文心一言生态圈快速扩大,应用前景广阔。百度通过与国网、泰康等各行业头部企业合作,基于通用数据训练的文心大模型,加上各行业应用场景中的特有大数据和知识,进行行业模型精调,已发布十多个行业大模型,加速推动产业智能化升级。此外文心一言自官宣以来,已有超过650家企业宣布接入文心一言,快速构建起庞大的生态圈。随着通用AI产品的技术迭代和成本降低,未来将有望突破更多核心场景,实现AI普惠。 投资建议:随着GPT-4与百度文心一言大模型发布,人工智能迎来发展里程碑。微软推出Microsoft365Copilot,将人工智能技术整合 到其Office办公软件中,使得办公进入智能化时代。百度文心一言自官宣以来已经有超过650家企业宣布接入,生态圈快速扩大。在模型开发与应用层面,AI均迎来历史性进展,我们从五个维度筛选投资标的:1)算法层面,重点关注三六零、科大讯飞;2)应用层面,重点关注金山办公、彩讯股份、拓尔思、虹软科技、云从科技、凌志软件、新国都等;3)算力层面,重点关注景嘉微、寒武纪、海光信息、浪潮信息、中科曙光等;4)与OpenAI合作,重点关注 熵基科技、万兴科技;5)与百度文心一言合作,重点关注致远互联、宇信科技、汉得信息。 风险提示:AI技术发展不及预期;AI应用场景落地速度不及预期; AI引发各种法律与伦理问题;行业竞争加剧。 1.GPT-4与百度文心一言发布,人工智能历史性时刻 1.1GPT-4性能大幅提升,多模态为最大亮点 3月15日凌晨,OpenAI发布多模态预训练大模型GPT-4。GPT-4被称为世界第一款高体验、强能力的先进AI系统,在多个方面实现飞跃式提升。 1.1.1GPT-4实现了更优的性能 OpenAI在为机器学习模型设计的传统基准上评估了GPT-4,GPT-4大大优于现有的大型语言模型,以及大多数SOTA模型。 图表1:GPT-4大大优于现有的大型语言模型,以及大多数SOTA模型 资料来源:OpenAI官网,太平洋证券研究院 首先,GPT-4输入端有飞跃式提升。GPT-4文字输入限制提升至2.5万字,是ChatGPT的8倍左右。 图表2:GPT-4文字输入限制大幅提升 资料来源:机器之心,太平洋证券研究院 请务必阅读正文之后的免责条款部分守正出奇宁静致远 GPT-4在各类测试中的表现明显优于GPT-3.5。OpenAI称,GPT-4在各种专业和学术领域的基准测试中表现出了“人类水平”的性能。在SAT考试中,GPT-4的分数是1410 分,高于88%的应试者;在GRE考试中,GPT-4的分数是332分;在律师资格考试中,GPT-4的分数排在应试者的前10%左右;在AP微积分考试中,GPT-4也通过了测试。在多数领域中,GPT-4的分数和排名均优于上一代GPT-3.5。 图表3:GPT-4在多数考试中排名优于GPT-3.5 资料来源:OpenAI官网,太平洋证券研究院 图表4:GPT-4在多数考试中分数优于GPT-3.5 资料来源:OpenAI官网,太平洋证券研究院 GPT-4的语言能力也明显更强。许多现有的机器学习基准测试都是用英语编写的,从而其在英语这一语言环境中的能力更强。研究团队使用AzureTranslate将MMLU基准 (一套涵盖57个主题的14000个多项选择题)翻译成多种语言,在测试的26种语言的24种中,GPT-4优于GPT-3.5和其他大语言模型(Chinchilla、PaLM)的英语语言性能,可见GPT-4在其他语言上也拥有很强的能力。 图表5:GPT-4语言性能更优 资料来源:OpenAI官网,太平洋证券研究院 尽管GPT-4与早期的GPT模型相似仍具有不完全可靠等局限性,但已经显著减轻了幻觉问题。在OpenAI的内部对抗性真实性评估中,GPT-4的得分比最新的GPT-3.5模型高40%,GPT-4在TruthfulQA等外部基准测试方面也取得了进展,OpenAI测试了模 型将事实与错误陈述的对抗性选择区分开的能力,实验结果表明,GPT-4基本模型在此任务上仅比GPT-3.5略好;然而,在经过RLHF后训练之后,二者的差距就很大了。 图表6:在OpenAI的内部对抗性真实性评估中,GPT-4的得分比最新的GPT-3.5模型高40% 图表7:经过RLHF后训练之后,GPT-4的优势更加明显 资料来源:OpenAI官网,太平洋证券研究院资料来源:OpenAI官网,太平洋证券研究院 1.1.2GPT-4多模态功能成为焦点 GPT-4可以接受文本和图像等形式的输入,新能力与纯文本设置并行。具体来说, 它在人类给定由散布的文本和图像组成的输入的情况下生成相应的文本输出(自然语言、代码等)。在一系列领域(包括带有文本和照片的文档、图表或屏幕截图上)GPT-4展示了与纯文本输入类似的功能。我们认为,这突破了此前GPT-3.5纯文本的交互,实现了多模态交互,是GPT-4最大的亮点。 图表8:给GPT-4一个长相奇怪的充电器的图片,问为什么这很可笑 图表9:GPT-4回答道,VGA线充iPhone 资料来源:OpenAI官网,太平洋证券研究院资料来源:OpenAI官网,太平洋证券研究院 图表10:让GPT-4做物理题图表11:GPT-4看懂了法语题目,并完整解答 资料来源:OpenAI官网,太平洋证券研究院资料来源:OpenAI官网,太平洋证券研究院 1.1.3面向公众开放,商业化落地持续推进 GPT-4发布后,OpenAI直接升级了ChatGPT,向公众开放。ChatGPTPlus订阅者可以在官网获得具有使用上限的GPT-4访问权限。要访问GPT-4API(它使用与 GPT-3.5-turbo相同的ChatCompletionsAPI),用户可以注册等待。获得访问权限后,用户目前可以向GPT-4模型发出纯文本请求(图像输入仍处于有限的alpha阶段)。 制定了明确的定价方案,商业化落地推进。GPT-4定价为每1k个prompttoken0.03 美元,每1k个completiontoken0.06美元。默认速率限制为每分钟40k个token和每分钟200个请求。GPT-4的上下文长度为8,192个token。OpenAI还提供了32,768个token上下文(约50页文本)版本的有限访问,该版本也将随着时间自动更新(当前版本GPT-4-32k-0314,也支持到6月14日)。定价为每1Kprompttoken0.06美元和每1kcompletiontoken0.12美元。 1.2百度文心一言问世 文心一言的推出是百度多年在AI努力的延续。百度十几年前就开始投入AI研究, 2019年推出了文心大语言模型,迭代了多轮,已经从单一的自然语言理解延伸到多模态包括视觉、文档、文图、语音等,“文心一言”大模型是基于文心大模型迭代发展 而来的。图表12:百度文心大模型迭代过程 资料来源:百度官微,太平洋证券研究院 1.2.1文心一言具备五大能力 通过一轮轮对话的测试,文心一言体现出了文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成五大能力。 1)文学创作。“总结三体的核心内容”体现了文心一言的总结分析能力,“续写三体”体现了内容创作生成能力,“于和伟和张鲁一有哪些共同点、于和伟和张鲁一谁更高”等问题背后体现的是文心一言的推理能力。 图表13:文心一言从哲学角度续写《三体》 资料来源:百度文心一言发布会,太平洋证券研究院 2)商业文案创作。AI要写好一篇稿子,除了需要准确理解我们的意图,还要有清晰的表达能力,这背后的基础是庞大的数据规模。文心一言大模型的训练数据就包括万亿级网页数据,数十亿的搜索数据和图片数据,百亿级的语音日均调用数据,以及 5500亿事实的知识图谱等,这让百度在中文语言的处理上,能够处于独一无二的位置。 图表14:文心一言给公司起名 资料来源:百度文心一言发布会,太平洋证券研究院 3)数理逻辑推算。对于鸡兔同笼一类的题目的例子可以看出,文心一言不仅知道题出的对不对,不仅能简单的给出答案,也给出了解题步骤,有逻辑地一步一步推理。文心一言已具备了一定的思维能力,能够学会数学推演及逻辑推理这类相对复杂的任务。 图表15:文心一言计算鸡兔同笼问题 资料来源:百度文心一言发布会,太平洋证券研究院 4)中文理解。作为扎根于中国市场的大语言模型,文心一言具备中文领域最先进 的自然语言处理能力。文心一言不仅理解“洛阳纸贵”的意思,并且可以以“洛阳纸贵”四个字写一首藏头诗,展现了文心一言在中文上的优势。 图表16:文心一言能够理解“洛阳纸贵”的意思并且作藏头诗 资料来源:百度文心一言发布会,太平洋证券研究院 5)多模态生成。文心一言可以为2023世界智能交通大会制作海报、用四川话读等,可见文心一言可以生成文本、图片、音频和视频,展示了多模态生成能力。 图表17:文心一言可以生成图片图表18:文心一言可以输出语音 资料来源:百度文心一言发布会,太平洋证券研究院资料来源:百度文心一言发布会,太平洋证券研究院 1.2.2文心一言背后是全栈人工智能技术 文心一言是新一代大语言模型、人工智能产品,背后是百度全栈的人工智能技术。经过十余年的布局,百度已经积累了全栈的人工智能能力,从芯片层、框架层、模型 层到应用层,百度都有领先的技术和产品,这四层之间能够形成层到层的反馈、端到端的优化。文心一言快速推出也是基于十余年的积累。 图表19:百度人工智能全栈布局 资料来源:百度文心一言发布会,太平洋证券研究院 2.大模型的应用价值更加值得期待 2.1微软发布Microsoft365Copilot,办公进入智能化时代 微软宣布推出Microsoft365Copilot,将下一代人工智能技术整合到其Office办公软件中。Copilot是由OpenAI的最新一代大型语言模型GPT-4驱动的,以聊天机器人的形式出现