事项: 3 月 14 日,GPT4 发布,实现多模态输入输出;3 月 16 日,百度召开文心一言大模型发布会;3 月 16 日,微软推出 Microsoft 365 Copilot ,将 GPT-4 技术引入 Office 办公软件。 国信计算机观点: 1)GPT4 模型近期发布,是 AI 大模型的里程碑事件,其实现了多模态的输入和输出,是迄今为止功能较为强大的大型多模态模型;2)微软推出 Microsoft 365 Copilot,GPT-4 技术已经充分赋能了 PPT、WORD、EXCEL 等常用的办公场景,微软办公产品与服务的性能有望大幅提升,其 Office 产品有望成为海外首批大规模落地的场景,并为众多的产品和应用提供较强的示范效应;3)百度文心一言大模型的发布,预示着国内的应用开始进入 AI 赋能时代,预期后续不断会有新应用产生,在众多成为百度生态的企业中,随着百度大模型能力的升级迭代,有望出现现象级应用产品;4)投资建议:人工智能技术不断突破,在应用端充分赋能,应用产业有望迎来新的发展机遇。我们认为:第一,具有海外产品和业务的公司在引入人工智能技术,尤其是和 OpenAI 合作后将迎来应用的全新升级,客户的付费意愿、续费意愿、产品用户数量等指标都将迎来积极向上变化,相关公司有凌志软件等;第二,百度在国内推出文心一言大模型,目前已经有 650 家左右的公司宣布成为生态合作伙伴,随着国内大模型的能力快速提升,国内应用层企业有望迎来产品性能的大幅提升,AI 重塑应用后将为国内企业带来新的发展机遇,国内具有 AI 应用和场景的系相关公司有科大讯飞、金山办公、彩讯股份、同花顺、用友网络、京北方、三六零等。 评论: GPT4 发布是 AI 产业化中的里程碑事件 3 月 14 日,OpenAI 正式发布多模态大模型 GPT-4,迭代速度较快。创始人 Sam Altman 表示,GPT-4 是迄今为止功能最强大、最一致的大型多模态模型,能够接受图像和文本输入,在各种专业和学术基准上均表现出了人类水平。人工智能的发展已经进入了认知智能领域,文本智能、图像智能、音频智能、视频智能以及多模态认知智能,将会逐步诞生,未来为了应对复杂和多变的应用场景,多模态智能的发展方向将成为必然。(所谓的多模态智能是指大模型对于文本数据、图像数据、音频及视频数据能够进行多模联合处理) GPT-4 相比 GPT-3.5 的优势主要体现在:1)结果更可靠:GPT-4 的响应结果为“禁止内容请求”的概率较GPT-3.5 降低 82%;正确响应的概率提升 40%,在大多数学术性考试中的表现均超过 GPT-3.5,10 秒内即可创建网站、游戏及其他应用的代码及注释,根据用户需求提出修改思路;2)支持图像和文本输入功能:GPT-4 已在更庞大的数据集上进行了训练,抓取图片细节的能力惊人并拥有人类的“幽默感”。 图1:九类专业问题的响应准确率显著高于早期版本的模型 图2:GPT4 准确描述了漫画图片的“笑点”在哪 在新的模型发布的同时,OpenAI 还推出 GPT-3.5-turbo API,进一步提升模型集成规模。OpenAI 于 2023年 3 月 1 日宣布推出 ChatGPT 和 Whisper 模型 API,以应对 ChatGPT 模型的成本高和操作复杂等问题。通过使用专用实例,开发者可拥有独家使用权,完全控制实例的多维功能,保证响应迅速且稳定,更轻松地将 ChatGPT 模型集成到他们的应用和产品中的接口服务。 具体来说,OpenAI 目前的训练模型主要应用于 Fine-tuning(微调),Embedding(嵌入)和 Completion(补全)。本次发布的 GPT-3.5-turbo 模型主要应用于 Completion-Chat,模型调用价格降低 90%,使用2.7 美金(约 18 元人民币)可输出 100 万个单词。OpenAI 表示,使用成本的大幅下降来自于模型架构、算法算力的优化,这种优化会持续进行,成本仍有下降空间,将于 4 月发布 gpt-3.5-turbo 的下一个稳定版本。目前,第一批接入 ChatGPT API 的企业包括 Snap、Quizlet、Shopify 等公司,推出的应用已经涵盖了购物、社交、教育、配送等各类场景。 表1:新旧接口的特点对比 微软推出 Microsoft 365 Copilot,GPT-4 技术充分赋能诸多办公场景 3 月 16 日,微软发布了 Microsoft 365 Copilot,将 GPT-4 技术充分赋能了 PPT、WORD、EXCEL、Outlook、Meeting Recap、Teams Meeting 等常用的办公场景。具体来说,由于 AI 技术的充分赋能,未来越来越多的重复性工作将被取代:1)Dynamics 365 Copilot 通过整合 CRM 和 ERP 系统,能够帮助客户从各个业务层面加速创新和增进营收;2)Copilot 能够帮助销售显著减少花在案头工作上的时间,帮忙编写给客户的电子邮件回复,也能在 Outlook 中自动生成一个 Teams 会议的总结邮件;3)Copilot 能帮助服务专员提供更好的客户体验;4)Copilot 能帮助市场推广人员简化数据发现、受众分析、内容创作等环节的工作流程;5)Copilot 能够为电子商务梳理和创建产品列表,几秒钟就能自动生成用于在线商店的商品简介。AI 技术通过对办公软件产品的赋能,进而赋能具体的业务场景,为使用者带来快速、极致的体验。 图3:微软已经将 GPT-4 接入多个办公场景产品 目前微软已经将 ChatGPT 的技术接入了很多业务条线。目前,微软的三大业务线(智能云、生产力和业务流程、个人计算业务)中的部分关键产品均已接入 ChatGPT。以 Office 为例,微软已经推出 Microsoft 365 Copilot,通过赋能办公产品的方式来赋能具体的业务场景。 表2:微软三大业务中已接入 ChatGPT 的产品线 Jasper 公司已经通过利用 OpenAI 的大模型已经完成了营销文案和 AI 绘画的应用。微软的应用为海外产品的百花齐放奠定了良好的开端。Jasper 成立于 2020 年,2021 年、2022 年营收分别为 4000 万美元、7500万美元。Jasper 的商业模式是以类 SAAS 服务的形式进行收费,大致分为初级、高级和订制三个模式。2022年 10 月,Jasper 获 1.25 亿美元 A 轮融资,估值达 15 亿美元。在产品层面,Jasper 为用户提供 50 类以上的文案模板、29 类语言服务,高级订阅包括 SEO(搜索引擎优化)等内容,2022 年 11 月至 2023 年 2 月,公司周活用户数量已增长 63.9%。 图4:Jasper 产品以及优势介绍 图5:Jasper 周活(2022.11.1-2023.2.14) Twilio,为 OpenAI 提供集成服务的云通信平台企业。1)Twilio 为客户提供一系列自动化文本和聊天功能,该公司以在多个行业拥有一系列标志性客户而闻名。其中一位重要客户就是 OpenAI,Twilio 为 OpenAI 提供集成服务,在 2029 年预计 1.3 万亿美金的 AI 市场掘金。Twilio 推出的新产品,将会对线上客服人员进行替代;2)新产品将 GPT-3 集成到聊天机器人,形成云呼叫中心,这将为公司节省数百万美元的客户服务人员。这项服务已经被一系列著名的公司使用,云联络服务中心市场将以 22.7%的复合年增长率稳步增长,预计 2027 年将达到 573 亿美金。 图6:使用 Twilio 创建与机器人的短信对话 图7:创捷定制化机器人的条件:JavaScript、Twilio 账户 QuickVid,助 AI 生成高质量的短视频。AI 音视频创作相对处于早期阶段,市场上已有许多音视频创作工具能够实现图文生成视频的能力,极大降低了音视频内容创作门槛。预计 AI 视频工具或成为下一个迎来爆发的细分领域。QuickVid 致力于将多个生成式 AI 系统进行整合,用于自动创建短视频内容。用户只需输入一个单词,QuickVid 就能从库中选择一个背景视频,编辑脚本和关键字,并添加合成配音和背景音乐,最终生成视频。视频生成机制如下:1)基于给出的提示,利用 GPT-3 的生成文本功能生成短视频脚本;2)背景视频:从脚本中自动提取或手动输入的关键字,从免费的 Pexels 库中选择背景视频,叠加由DALL-E 2 生成的图像;3)背景音乐:调用 Google Cloud 的文本转语音 API 添加来自 YouTube 免版税音乐库的合成画外音和背景音乐。 图8:输入提示词“Cat”后所展示的工作流程 Bluemail,ChatGPT 驱动的应用程序 BlueMail 获准在苹果商店更新。Bluemail 是一款布置精致、功能齐全、便于应用的通用电子邮件应用程序。2023 年 3 月 3 日,公司请求添加由 ChatGPT 实现的新功能,被苹果要求增加内容过滤功能或者把 APP 适用人群改到 17 岁以上,修改后于 3 月 5 日再次申请,顺利得到苹果的批准。联合创始人 Ben Volach 表示,苹果要求开发者保证该应用程序具有内容控制功能,希望后续苹果可以公开任何有关在应用程序中使用 ChatGPT 或其他类似 AI 系统的新政策。通过先进的人工智能技术,用户现在可以体验到更快、更高效的邮件写作和回复方式。BlueMail GEM 在回复以前的邮件时提供上下文和相关信息。GEM 根据电子邮件的上下文建议自动回复,节省用户的时间和精力。 图9:Bluemail 的新功能将为用户提供精确的摘要,节省邮件阅读时间 百度文心一言发布,国内应用有望百花齐放 3 月 16 日,百度发布了文心一言大模型,在发布会上,李彦宏具体展示了包括文学创作、商业文案创作、数理逻辑推算、中文理解以及多模态生成的相关内容。总体来说百度的文心一言大模型的能力相对不错的,通过草根试用的节奏来讲,后续效果的提升值得期待,同时,文心一言也实现了多模态的生成(比如输入文字,输出图片等)。 图10:百度文心一言大模型发布会 图11:百度文心一言大模型发布会问题及回答 在百度大模型开放接口之后,国内的应用场景有望和国外的场景形成共振。我们认为海外的应用会和国内的应用形成共振,具体来说:1)客服聊天机器人领域,海外的公司有 Twilio、Jasper、Snapchat、Copy Al,国内对应的公司有京北方 、 凌志软件 、 新致软件 、 同花顺等 ; 2 ) 办公软件领域 , 海外的公司有Microsoft Office,国内的公司有金山办公、福昕软件、万兴科技;3)信息搜索与内容检索领域,海外的公司有 Microsoft Bing、ShiftPixy,国内的有百度、三六零、拓尔思;4)语音识别与翻译领域,海外的有 Whisper,国内的有科大讯飞;等等还有邮箱、教育、内容推荐、低代码开发、企业管理等领域的公司和应用。 表3:ChatGPT 潜在应用领域的中美映射 在海外有产品和业务的公司有很多,以福昕软件、万兴科技为例: 福昕软件:国产 PDF 领先厂商 公司成立于 2001 年,成立之初专注于 PDF 电子文档相关的软件产品及服务。目前,福昕软件已成为拥有自主知识产权、具备自主研发能力且具有国际竞争力的基础软件、通用软件企业。公司全部业务均基于自主研发的核心技术体系而形成,PDF 编辑器与阅读器是公司的核心产品。除了之前提到的具有体积小、速度快、跨平台等特性外,还拥有互联 PDF、PDF 文档无障碍阅读等创新特色功能。2017-2021 年公司营收从2.2 亿元增至 5.41 亿元,毛利率由 92%增至 97%。 2023 年 3 月,福昕软件宣布成为百度“文心一言”首批生态合作伙伴,后续将优先内