您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国金证券]:计算机行业深度研究-“文心一言”发布-国内应用预计加速 - 发现报告
当前位置:首页/行业研究/报告详情/

计算机行业深度研究-“文心一言”发布-国内应用预计加速

计算机行业深度研究-“文心一言”发布-国内应用预计加速

投资逻辑 百度于2023年3月16日召开关于“文心一言”的主题发布会,“文心一言”作为国内首款正式发布的生成式语言大模型,拥有文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成等功能。文心平台依托于百度自研的产业级深度学习平台飞桨(PaddlePaddle)打造,致力于为用户提供一站式AI开发服务: AI大模型与行业大模型:文心平台提供NLP、CV、跨模态、生物计算四大主流AI研究领域的多个基础大模型,多个模型在技术层面实现突破创新,处于世界领先水平。其中,NLP领域的ERNIE3.0Zeus采用自回归网络和自编码网络,能够兼顾自然语言理解和生成功能;CV领域的VIMER-UFO2.0使用超网络结构,推理时仅需激活总参数量的1/30;ERNIE-ViLG2.0引入基于语言和图像的知识增强算法,在文本图像生成任务中的表现已经超越了OpenAI旗下的DALLE-2。文心平台与各行业企业联手打造行业大模型,目前已覆盖能源、金融、航天、制造、传媒、城市、社科、电影等8个领域。目前已有650余家知名企业宣布接入“文心一言”,涵盖企业服务、金融IT、汽车、传媒、教育、家电、金融等10余个行业。 一站式开发平台与开发工具:开发平台方面,文心面向专业知识有限的AI应用开发者提供零门槛平台EasyDL,面向专业开发者提供全功能平台BML。目前这两个平台均仅支持使用百度文心的云端算力,可采用公有云、私有化离线、软硬一体等部署方式。开发工具方面,文心提供ERNIEKit自然语言处理开发工具及PaddleFleetX全流程开发套件。此外,现阶段文心平台还向开发者免费提供大模型API。 产品与社区:百度文心通过构建产品与社区经营,对外展示生成式模型的强大性能,以此吸引爱好者投入创作,进而构筑成熟的AIGC社区,可在实践中探索AI商业化模式。目前除“文心一言”外,文心平台提供产业级搜索系统“文心百中”、艺术创意辅助平台“文心一格”,以及采用众创模式的旸谷社区。 目前百度文心生成式语言大模型在参数规模、技术创新、应用落地方面均在国内同业中处于领先水平。3月16日起,“文心一言”首批用户可通过邀请测试码接入体验,同时百度智能云将面向企业客户开放“文心一言”API调用接口,有望进一步丰富百度AI生态,赋能更多行业伙伴。 投资建议 相较于ChatGPT等海外模型存在连接限制,百度文心平台可以为国内用户提供更便捷的技术入口。“文心一言”的发布将极大加速国内生成式AI模型的落地应用节奏,有望帮助生态伙伴实现用户体验提升和生产降本增效。建议关注接入“文心一言”生态的公司,如恒生电子、用友网络、汉得信息、凌志软件、宇信科技等。 风险提示 海外基础软硬件使用受限;应用落地不及预期;行业竞争加剧风险。 内容目录 1.百度文心平台可提供一站式AI开发服务3 2.文心平台提供四大主流领域AI大模型及行业大模型3 3.文心平台提供一站式开发平台与工具9 4.文心平台提供搜索、创作等产品12 5.国内其他生成式语言模型14 6.投资建议14 7.风险提示14 图表目录 图表1:百度文心平台全景图3 图表2:文心NLP大模型可支持语言理解、语言生成等功能3 图表3:ERNIE3.0Zeus创新性地提出知识增强方法4 图表4:文心NLP大模型技术演进可划分为3条主线5 图表5:文心CV大模型可支持一站式视觉任务定制和应用服务5 图表6:VIMER-UFO2.0采用超网络结构6 图表7:文心跨模态大模型支持多场景应用6 图表8:ERNIE-ViLG2.0模型引入知识增强算法7 图表9:文心生物大模型在多任务中已达到世界领先水平7 图表10:文心行业大模型拥有丰富的合作案例7 图表11:文心行业大模型融合知识增强技术8 图表12:已有650余家公司接入百度“文心一言”9 图表13:EasyDL提供一站式零代码AI模型开发10 图表14:EasyDL可支持多场景任务10 图表15:BML全功能AI开发平台架构概览11 图表16:EasyDL与BML提供的模型部署方式11 图表17:EasyDL与BML提供的模型部署方式11 图表18:百度文心提供大模型API12 图表19:文心百中使用流程简单13 图表20:文心一格收费价格0.2-0.8元/张13 图表21:旸谷社区部分创意应用13 图表22:国内主流生成式语言模型对比14 1.百度文心平台可提供一站式AI开发服务 百度于2023年3月16日召开关于“文心一言”的主题发布会,“文心一言”作为国内首款正式发布的生成式语言大模型,可支持文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成等功能。文心平台依托于百度自主研发的产业级深度学习平台飞桨 (PaddlePaddle)打造,集先进的全领域AI大模型、全面的AI算法集、端到端开发套件和平台化服务于一体,致力为用户提供一站式AI开发服务。 图表1:百度文心平台全景图 来源:百度文心,国金证券研究所 2.文心平台提供四大主流领域AI大模型及行业大模型 文心大模型是百度文心平台的核心,包括自然语言处理(NLP)、计算机视觉(CV)、跨模态、生物计算四个主流AI研究领域下的多个基础大模型,此外百度文心还基于基础大模型与各行业企业深度合作、通过学习行业特色数据与知识而形成多个行业大模型。 2.1文心NLP大模型 文心NLP大模型是百度文心着重布局的领域,其主要面向语言理解、语言生成等NLP场景,包含一系列在功能和应用场景上各有侧重的语言大模型。 图表2:文心NLP大模型可支持语言理解、语言生成等功能 模型名称应用场景特点 ERNIE3.0Zeus 问答、智能创作、情感分析等各类自然语言理解和生成任务 文心旗下最先进的自然语言大模型,参数规模达千亿级,创新地采用知识增强方法。在各类真实场景的生成准确性、流畅性、相关性上全面领先业界其他大模型。 ERNIE3.0Tiny 各类自然语言理解和生成任务 ERNIE3.0的轻量级版本,应用模型压缩技术大幅降低了推理算力需求,在效果和ERNIE3.0持平的情况下获得数十倍至上百倍的速度提升。 ERNIE-Finance金融场景相关的NLP任务 在海量金融领域文本和通用文本上进行训练,具备丰富的金融领域知识,在金融问答,金融信息抽取等任务上表现较好 ERNIE-Health医疗场景相关的NLP任务学习了海量的医疗专业术语和医疗专业问答数 模型名称应用场景特点 据,以超越人类医学专家水平的成绩登顶中文医疗信息处理权威榜单CBLUE ERNIE-Code自然语言代码生成 采用多语言多任务联合训练的方式,支持100多种自然语言和15种编程语言。 ERNIE-UIE 产品反馈分析、服务质量评测、舆情监测等信息抽取场景 用户可以使用自然语言自定义抽取目标,无需训练即可抽取输入文本中的对应信息。 ERNIE-M跨语言的各类任务 突破了语料规模对多语言模型的学习效果限制,能够从单语语料中学习语言间的语义对齐关系 ERNIE-Search检索场景的多种任务以领先搜索能力登顶段落排序榜单MS-MARCO。 ERNIE-Sage搜索、推荐、问答等任务 能够同时对文本语义与图结构信息进行建模,显著提升了其在推荐场景的表现 PLATO对话场景 全球首个基于隐变量方式对话大模型,具备接近真人水平的多轮流畅对话能力,对话效果达到世界领先水平 来源:百度文心,国金证券研究所 ERNIE3.0Zeus是目前百度文心旗下最先进的自然语言大模型,发布于2022年5月。在架构设计上,ERNIE3.0Zeus采用Transformer作为骨干网络,并创新性地融合了自回归网络和自编码网络,使得模型同时具备了自然语言理解和自然语言生成能力。目前,以ChatGPT为首的大规模生成式预训练语言模型均仅基于自回归网络进行训练,导致这 类模型在自然语言理解任务上表现较弱。 在模型训练上,ERNIE3.0Zeus在GPT-3等传统大规模语言模型上做出了突破,创新性地提出了知识增强方法,在海量文本数据之外,将大规模知识图谱也引入模型训练过程,并持续对百余种不同形式的任务数据进行学习,实现了任务知识增强。相比于仅使用文本数据进行训练的传统大规模生成式预训练语言模型,ERNIE3.0Zeus对常识知识掌握更好,具备更强的知识推理能力。 图表3:ERNIE3.0Zeus创新性地提出知识增强方法 来源:百度文心,国金证券研究所 文心NLP大模型在技术演进上可以划分为ERNIE模型迭代、在多模态领域的进展、 PLATO模型迭代三条主线。 主线一:文心ERNIE的版本迭代。一方面,从2019年的文心ERNIE1.0到2022 年的ERNIE3.0Zeus的版本迭代中,文心NLP大模型在参数规模上实现了指数级 增长,最新的ERNIE3.0Zeus在参数规模上已与国际先进水平到达同一量级。 另一方面,百度文心在NLP大模型研发的四年中,创新性地提出了知识增强方法,这使文心NLP大模型具备比ChatGPT等同类语言模型更强的常识掌握和知识推理能力,并在SuperGLUE和GLUE等复杂语言理解榜单中多次登顶。 主线二:文心ERNIE在跨模态、跨语言任务方面的进步。一方面,跨语言学习任务的突破打破了语料规模对多语言模型的学习效果限制。长久以来,互联网中存在的高质量中文文本数据显著低于英文文本,跨语言学习使得模型可以从英文数据中学习到适用于中文文本的语言联系,大大降低了模型训练对海量中文训练数据的要求。 另一方面,跨模态学习任务的突破为百度文心NLP大模型的发展奠定了良好的技术基础。百度文心在ERNIE-Sage首次对图结构进行了学习,使AI模型获得了同时学习文本信息和图结构的能力。知识增强技术是百度文心NLP大模型的核心技术路线之一,而知识图谱作为知识增强技术的实现方式同样采用图结构。跨模态学习任务的突破将推动百度文心知识增强方法的演进,未来有望实现图结构和文本信息对齐,使得AI具备常识掌握能力。 主线三:对话生成大模型文心PLATO迭代演进。一方面,从2019年的PLATO到2021年的PLATO—XL,文心语言大模型实现了参数规模的迅猛增长,这使得文心语言大模型的智能水平出现了较为显著的提高。 另一方面,PLATO在技术路线上创新性的采用了基于隐变量的模型构建方式,使得模型在不降低鲁棒性的前提下,开放域对话生成能力进一步增强。 图表4:文心NLP大模型技术演进可划分为3条主线 来源:百度文心,AI大模型公众号,国金证券研究所 2.2文心CV大模型 文心CV大模型基于领先的视觉技术,利用海量的图像、视频等数据训练,致力于为企业和开发者提供强大的计算机视觉基础模型,以及一站式视觉任务定制与应用服务。 图表5:文心CV大模型可支持一站式视觉任务定制和应用服务 模型名称应用场景特点 VIMER-UFO2.0智慧城市 视觉多任务统一大模型,可针对特定任务抽取轻量级小模型,兼顾大模型效果和小模型推理性能,能够有效减少推理算力消耗,易于落地部署 VIMER-CAE 图像分类、图像检测、图像分割 先进的视觉自监督预训练模型,在图像分类、目标检测、语义分割等达到世界领先水平 VIMER-StrucTexT2.0 OCR文字识别 端到端文档OCR表征学习预训练模型,在5项不同文档图像理解任务上刷新记录 VIMER-UMS 商品识别、多模态搜索与推荐、零售快消数字化等 基于海量的互联网商品图文信息训练,显著改善商品视觉检索和商品多模态检索体验 来源:百度文心,国金证券研究所 VIMER-UFO2.0是目前百度文心旗下最先进的视觉大模型,其创新性的提出了视觉多任 务的超网络与训练方案,使模型无需对下游任务进行微调,便可直接应用处理多个任务,以智慧城市场景为例,VIMER-UFO2.0可以用单模型实现人脸识别、人体和车辆多重识别等场景任务。 VIMER-UFO2.0在底层架构上采