您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[东方证券]:文心一言发布在即,大模型有望引领产业智能化变革 - 发现报告
当前位置:首页/行业研究/报告详情/

文心一言发布在即,大模型有望引领产业智能化变革

信息技术2023-03-12浦俊懿、陈超、谢忱东方证券✾***
文心一言发布在即,大模型有望引领产业智能化变革

行业研究|深度报告 看好(维持) 文心一言发布在即,大模型有望引领产业智能化变革 计算机行业 国家/地区中国 行业计算机行业 报告发布日期2023年03月12日 核心观点 ChatGPT热度不减,大模型发展迈进新时代。ChatGPT发布至今已经过去4个多月,但热度仍然不减。2023年3月,OpenAI上线了基于GPT-3.5Turbo模型的 ChatGPTAPI,允许第三方开发人员通过API将ChatGPT集成到他们的应用程序和服务中,相比于之前一代开放的Davinci模型成本降低了90%,有望加速其在商业化领域的落地。目前AIGC领域的产业格局已初步建立,可分为基础层、中间层和应用层。我们认为,完整的大模型在垂直场景落地中会出现成本过高,专业领域知识不足等问题,模型蒸馏技术可以在大模型的基础上针对于垂直领域进行小规模增量训练,形成垂直小模型,有助于大模型在垂直领域的深入拓展。MaaS也将有望成为未来大模型落地的新形态。 百度文心一言即将发布,生态优势逐渐建立。百度官方宣布,文心一言将于3月16日正式发布。文心一言是百度基于其文心大模型技术推出的大语言模型,将率先在内容和信息相关的行业和场景落地。百度基于自身的生态优势,旗下多款应用如百度知道、百度文库、百度知识图谱、百度搜索等均能有效支撑大模型的训练与迭 代,助力文心大模型快速成长为全球领先的大模型之一。截至2023年3月3日,已有400多家企业官宣首批接入百度文心一言,B端的生态圈迅速扩大。我们认为,随着文心一言的首批生态企业应用逐步落地,百度将建立起开发者及用户调用和模型迭代之间的飞轮,加速构建开放繁荣的技术生态。 大模型的应用落地有望带来产业智能化变革。目前,基础大模型距离大规模产业应 用并成为产业基座还有很长的一段路要走,需要“大模型+接口平台+生态应用”三层协同共建来促进AI和产业共同发展。目前微软已经将ChatGPT接入到了旗下多款产品线,我们认为,未来大模型将率先在B端带来应用落地,大模型与办公、OA、ERP、代码生成等场景天然契合,能有效促进企业经营管理全流程的降本增效。同时,通过对大模型进行蒸馏出的行业模型,可以在参数规模大幅减少的情况下,在垂直领域达到甚至超过大模型的表现,大大降低了模型的训练和服务成本,让大语言模型技术能够和垂直行业深度融合,迎来产业的智能化变革。 投资建议与投资标的 我们认为,未来几年是大模型的快速发展窗口期,相关的大模型算法、算力基础设施、下游B端通用应用软件和垂直行业领域都有望迎来加速增长。 大模型和算法能力领域,建议关注三六零(601360,未评级)、科大讯飞(002230,买入)等公司。 算力基础设施领域,建议关注中科曙光(603019,买入)、海光信息(688041,买入)、浪潮信息(000977,未评级)、寒武纪-U(688256,未评级)等公司。 B端通用应用软件领域,建议投资者关注致远互联(688369,未评级)、ST泛微(603039,未评级)、用友网络(600588,买入)、鼎捷软件(300378,未评级)、彩讯股份(300634,未评级)、金山办公(688111,增持)、汉得信息(300170,未评级)、拓尔思(300229,未评级)等公司。 垂直行业领域,建议关注万兴科技(300624,未评级)、嘉和美康(688246,未评级)、远光软件(002063,买入)、宇信科技(300674,未评级)等公司。 风险提示 大模型落地不及预期;政策监管风险 浦俊懿021-63325888*6106 pujunyi@orientsec.com.cn 执业证书编号:S0860514050004 陈超021-63325888*3144 chenchao3@orientsec.com.cn 执业证书编号:S0860521050002 谢忱xiechen@orientsec.com.cn 执业证书编号:S0860522090004 杜云飞duyunfei@orientsec.com.cn 覃俊宁qinjunning@orientsec.com.cn ChatGPT引领AI新浪潮,AIGC商业化启2023-02-08 程 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 目录 一、ChatGPT关注度高企,产业格局初步形成4 1.1ChatGPT热度不减,GPT-4有望引领下一风口4 1.2产业格局雏形初成,大模型发展进入新时代6 二、“文心一言”发布在即,百度生态优势显著8 2.1百度“文心一言”发布在即,B端生态圈持续扩大8 2.2百度自身生态完备,支撑大模型的训练迭代12 三、大模型产业应用展望,有望加速产业智能化变革14 3.1大模型+办公:多场景体验优化14 3.2大模型+OA/ERP/RPA:全流程效率提升17 3.3大模型+代码生成:开发门槛进一步降低18 3.4大模型+行业:垂直场景深度融合18 3.4.1医疗行业18 3.4.2教育行业19 3.4.3金融行业20 投资建议与投资标的21 风险提示21 图表目录 图1:OpenAI推出付费试点订阅计划ChatGPTPlus4 图2:OpenAI上线基于GPT-3.5Turbo的ChatGPTAPI4 图3:部分主流模型大小5 图4:DALL-E2从文字生成图片6 图5:Make-A-Video从文字生成视频6 图6:AIGC产业生态体系三层架构6 图7:GPT-3Demo网站基于GPT模型的开发的程序7 图8:从大模型训练得到小模型的过程示意7 图9:大模型的应用落地场景梳理8 图10:文心大模型全景图9 图11:文心大模型发展历程9 图12:百度文心一格产品10 图13:百度文心百中产品10 图14:百度知道12 图15:百度文库12 图16:2021年至今我国搜索引擎的市场份额分布13 图17:百度知识图谱13 图18:百度搜索13 图19:百度人工智能领域“芯片-框架-模型-应用”四层技术栈13 图20:“大模型+平台+生态”三层协同加速产业智能化14 图21:TeamsPremium智能回顾可自动生成会议纪要15 图22:TeamsPremium支持AI实时翻译15 图23:VivaSales可以自动生成邮件答复15 图24:个人开发者开发的ChatExcel应用16 图25:个人开发者开发的ChatBA应用16 图26:Dynamics365Copilot支持智能创建产品描述17 图27:Dynamics365Copilot支持智能供应链管理17 图28:Copilot在VS2022中的应用18 图29:炎黄盈动发布国内首个AI低代码平台18 图30:ChatGPT对症状描述提供诊断19 表1:全球科技巨头对类ChatGPT产品的布局4 表2:部分文心一言生态圈公司梳理(截至2023年3月8日)10 一、ChatGPT关注度高企,产业格局初步形成 1.1ChatGPT热度不减,GPT-4有望引领下一风口 ChatGPT热度持续。2022年11月30日,OpenAI公司上线了聊天机器人模型ChatGPT,迅速引发了全球的热潮。ChatGPT是一种预训练的语言大模型,采用大量的参数和大量的数据进行训练,基于人类反馈的强化学习算法,将NLP技术和机器学习结合,极大地提升了模型算法的效率和能力。仅在推出两个月后,ChatGPT的月活用户就突破了一亿,成为史上用户数增长最快的消费级应用。全球科技巨头也纷纷开始布局AI大语言模型,新一轮的人工智能竞赛正在上演。 表1:全球科技巨头对类ChatGPT产品的布局 公司 布局 微软 微软已经宣布在Bing搜索、Azure云服务、Teams等产品中加入ChatGPT技术,并有望在Office套件中也集成ChatGPT 谷歌 基于LaMDA模型推出ChatGPT的竞品——Bard,并向人工智能初创企业Anthropic投资3亿美元 Meta 官宣将开源新的大预言模型LLaMA,范围从70亿到650亿参数,但是使用更多数据训练 百度 宣布将在2023年3月推出类ChatGPT产品“文心一言”,英文名ERINEBot 阿里 基于2022年提出的阿里通义大模型,达摩院版类ChatGPT产品正在内测,可能将AI大模型技术与钉钉生产力工具深度结合 京东 京东云宣布将推出产业版ChatGPT,命名为ChatJD,预计参数量为千亿级,主要应用在零售和金融2个领域 网易 网易有道未来或将推出ChatGPT同源技术产品,应用场景围绕在线教育 360 正计划尽快推出类ChatGPT技术的demo 科大讯飞 宣布AI学习机将成为公司类ChatGPT技术率先落地的产品,将于今年5月发布 数据来源:澎湃、腾讯、百度、京东云、科大讯飞等,东方证券研究所 OpenAI发布GPT-3.5Turbo模型,成本降低90%。2023年3月1日,OpenAI上线了基于GPT- 3.5Turbo模型的ChatGPTAPI,允许第三方开发人员通过API将ChatGPT集成到他们的应用程序和服务中,可以用于创建人工智能驱动的聊天界面,目前已经在Snap等多家企业应用。OpenAI表示,基于GPT-3.5Turbo的ChatGPTAPI相比于之前一代开放的Davinci模型成本降低了90%,目前定价为每一千个token收费0.002美元。在一个月前,OpenAI公司针对个人消费者推出了付费试点订阅计划ChatGPTPlus,定价为每月20美元。订阅制的商业模式较为轻量化,对于C端客户友好,具备良好的可推广性,是OpenAI对于ChatGPT商业化的初步尝试。我们认为,本次OpenAI上线的ChatGPTAPI是推动大语言模型商业化的重要一步,模型成本的大幅下降可以让ChatGPT更容易与各类应用进行整合,有望加速其在商业化领域的落地,通过吸引更多的用户来快速扩大市场份额,保持良好的竞争优势。 图1:OpenAI推出付费试点订阅计划ChatGPTPlus图2:OpenAI上线基于GPT-3.5Turbo的ChatGPTAPI 数据来源:OpenAI,东方证券研究所数据来源:OpenAI,东方证券研究所 GPT-4发布时间尚未明确,效率提升是重点。距离GPT-3模型的发布已经过去接近3年,随着基于GPT-3.5模型的ChatGPT大获成功,业界对GPT-4的期待和猜测也越来越多。根据OpenAI 首席执行官Altman在2023年1月18日的一次访谈,目前GPT-4还没有明确的发布计划,并且对网络传言“GPT-4的参数将达到100万亿”进行了驳斥,表示下一代的模型的参数将不会有巨幅提升,而是将重点放在效率的提升上,包括数据集、参数化、对齐度等方面。实际上,随着大模型的参数规模增大到一定程度后,增加参数数量对模型性能带来的提升将变得极小,参数数量并不一定和模型的性能呈直接关系。例如微软和英伟达联合开发的Megatron-TuringNLG模型,拥有超过5300亿参数,但在性能方面却不如某些相对体量较小的模型。 图3:部分主流模型大小 数据来源:英伟达,东方证券研究所 GPT-4将拥有多模态能力,有望引领行业下一浪潮。据德国媒体报道,在当地的一场人工智能相关活动上,微软德国CTO透露GPT-4将会于近期推出,并将具有多模态能力。多模态是当前行业内最受关注的算法方向之一,模型支持文字、图片、视频等的跨格式理解与分析,OpenAI之前推出的DALL-E就是一款优秀的文字生成图像的跨模态模型,Meta也曾推出过一款从文字生成视频的应用Make-A-Video。我们认为,未来的大模型的输入输出将不仅限于文字对话,而是能够支持图像、音频、视频等多种形式,强大的多模态能力将成为未来大模型的核心,引领下一次的行业浪潮。 图4:DALL-E2从文字生成图片图5:Make-A-Video从文字生成视