您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国盛证券]:华为盘古×META进阶篇 - 发现报告
当前位置:首页/行业研究/报告详情/

华为盘古×META进阶篇

信息技术2023-03-26刘高畅、孙行臻国盛证券听***
华为盘古×META进阶篇

计算机 华为盘古×META进阶篇 人工智能:首个多模态千亿级大模型,有望赋能百业。1)华为具备全栈全场景AI解决方案,为大模型提供坚实的软硬件平台,包括Ascend(昇腾)、CANN、MindSpore、应用使能四个层次。其中,MindSpore支持了盘古NLP 大模型、盘古CV大模型、科学计算大模型、多模态大模型等的开发训练:盘古NLP大模型是业界首个千亿参数的中文预训练大模型;盘古CV大模型业界最大CV大模型、首次实现兼顾判别与生成能力、在ImageNet上小样本学习能力上的业界第一;盘古气象大模型提供秒级天气预报;紫东.太初是全球首个图、文、音三模态大模型。2)华为盘古大模型加速行业应用的孵化与创新,边缘端引入行业应用伙伴,例如润和软件、常山北明、软通动力、云鼎科技、中科星图等,搭载openHarmony+AI大模型应用的国产化设备加速落地。 管理输出:打造Meta-X生态,重新定义企业数字化转型。1)随着ERP角色发生变化,企业前端业务系统逐渐独立,形成CRM、SRM等周边系统, 证券研究报告|行业周报 2023年03月26日 增持(维持) 行业走势 计算机沪深300 32% 16% 0% -16% -32% 2022-032022-072022-112023-03 围绕ERP建立生态体系成为重要趋势。2)在高端ERP市场,国外SAP和 Oracle占比达到53%,随着Oracle退出中国,国产ERP机遇浮现。3)华为打造Meta-X产品族,引入产品及实施伙伴,例如赛意信息、汉得信息、法本信息、能科科技、鼎捷软件,或将构建企业数字化良好生态。 信创软件:欧拉OS+高斯DB,生态合作共促繁荣。1)OpenEuler跨越生态拐点,根据2022年11月世界互联网大会披露,openEular累计装机量达 245万套,全球伙伴400+,全球开发者1.1万+。其中麒麟软件(中国软件子公司)贡献度排在首位,统信软件(诚迈科技子公司)、拓林思(创意信息子公司)紧跟其后。2)截至2022年底,openGauss已经在10+行业核心系统累计部署3万+套。截至2023年3月19日,贡献度最高的会员单位,除了华为和个人贡献者外,海量数据贡献度遥遥领先。 推荐标的:华为AI: 1)大模型端侧应用落地(结合鸿蒙OS):润和软件、常山北明、软通动力、云鼎科技、中科星图。 2)昇腾硬件伙伴:神州数码、拓维信息、广电运通、四川长虹。华为Meta-X: 1)MetaERP伙伴,赛意信息、汉得信息、法本信息。 2)MetaPDM伙伴,能科科技、鼎捷软件。华为信创: 1)高斯DB伙伴:海量数据。 2)欧拉OS伙伴:中国软件、诚迈科技、创意信息。 风险提示:AI技术迭代不及预期风险;财政支出不及预期;行业竞争加剧风险;贸易摩擦加剧。 作者 分析师刘高畅 执业证书编号:S0680518090001邮箱:liugaochang@gszq.com 研究助理孙行臻 执业证书编号:S0680122020018邮箱:sunxingzhen@gszq.com 相关研究 1、《计算机:数据要素顶层规划不断完善,“二十条”正加速落地》2023-03-19 2、《计算机:华为Meta×盘古,软件崛起》2023-03-19 3、《计算机:三剑齐发,超级时代》2023-03-18 请仔细阅读本报告末页声明 内容目录 一、人工智能:首个多模态千亿级大模型,有望赋能百业3 二、管理输出:打造Meta-X生态,重新定义企业数字化转型11 三、信创软件:欧拉OS+高斯DB,生态合作共促繁荣14 推荐标的18 风险提示18 图表目录 图表1:华为全栈全场景AI解决方案3 图表2:华为云盘古大模型4 图表3:各NLP大模型参数统计4 图表4:盘古CV大模型5 图表5:盘古气象大模型6 图表6:华为携手科研院所推出全球首个图文音三模态千亿大模型6 图表7:紫东太初的视频理解与描述性能获得顶会冠军7 图表8:AI框架MindSpore应用合作伙伴8 图表9:遥感调查传统方式8 图表10:华为在遥感数字经济合作方式9 图表11:雷达遥感预训练大模型9 图表12:云鼎科技与华为签署框架合作协议合作方向9 图表13:云鼎科技AI服务平台10 图表14:昇腾硬件合作伙伴10 图表15:2011-2021年国内ERP市场规模11 图表16:中国ERP市场竞争格局12 图表17:中国高端ERP市场竞争格局12 图表18:ERP系统在企业信息系统中的位置12 图表19:华为Meta-X产品13 图表20:华为MetaERP14 图表21:欧拉开源操作系统获得领先科技成果奖15 图表22:欧拉产业链16 图表23:openEuler伙伴贡献排名(截至2023年3月19日)16 图表24:2022年openGauss社区发展速览17 图表25:openGauss伙伴贡献排名(截至2023年3月19日)17 一、人工智能:首个多模态千亿级大模型,有望赋能百业 小模型到大模型成为重要发展趋势,大模型对软硬平台提出更高要求。1)大模型能够解决AI模型定制化和应用开发碎片化,可以吸收海量的知识,提高模型的泛化能力,减少对领域数据标注的依赖。2)大模型有利于激活深度神经网络对大规模无标注数据的自 监督学习能力,同时对于AI框架的深度优化和并行能力都有很高的要求,是深度学习框架下将AI做到极致的集大成者。 华为全栈全场景AI软硬件平台,包括Ascend(昇腾)、CANN、MindSpore、应用使能四个层次: Ascend(昇腾):即IP和芯片组层,提供基于统一、可扩展架构的系列化AIIP和芯片,包括Max、Mini、Lite、Tiny和Nano�个系列。 CANN(神经网络计算架构):提供芯片算子库和算子开发工具,关键组件是高度自动化算子开发工具TensorEngine,通过统一的DSL接口(TEInterface),配合预置的高层模板封装、自动性能调优等工具集合,让用户方便地在Ascend芯片上开 发自定义算子(CCElib-extension)。 MindSpore(AI框架):为支持端、边、云独立的和协同的统一训练和推理框架,包括模型库、图计算和调优工具包等核心子系统,具备ML/DL/RL的统一分布式架构,灵活的程序界面,并支持多种语言。 应用使能层:是一个机器学习PaaS,提供全流程服务、分层分级API以及预集成方案。ModelArts是面向开发者的一站式AI平台,为机器学习与深度学习提供海量数据预处理及交互式智能标注、大规模分布式训练、自动化模型生成,及端-边-云模 型按需部署能力,帮助用户快速创建和部署模型,管理全周期AI工作流。 图表1:华为全栈全场景AI解决方案 资料来源:Ascend官网,国盛证券研究所 MindSpore支持了盘古NLP大模型、盘古CV大模型、盘古科学计算大模型、多模态大模型等多种模型的开发训练。通过模型泛化,解决传统AI作坊式开发模式下无法解决的AI规模化、产业化难题。 图表2:华为云盘古大模型 资料来源:科学中国网,国盛证券研究所 1)NLP大模型:盘古NLP大模型是业界首个千亿参数的中文预训练大模型,在训练过程中使用了40TB的文本数据,包含了大量的通用知识与行业经验。2019年权威的中文语言理解评测基准CLUE榜单中,盘古NLP大模型在总排行榜及分类、阅读理解单项均 排名第一,刷新三项榜单世界历史纪录;总排行榜得分83.046,多项子任务得分业界领先,是目前最接近人类理解水平(85.61)的预训练模型。 图表3:各NLP大模型参数统计 资料来源:华为云官网,国盛证券研究所 2)CV大模型:盘古CV大模型首次实现模型按需抽取、业界最大CV大模型(30亿参数,10亿级图像)、首次实现兼顾判别与生成能力、在ImageNet上小样本学习能力上的业界第一。 首次兼顾图像判别与生成能力,捕捉样本决定性信息。1)图像中精准识别层次化的信息非常重要,例如“如何区分白色猫和白色狗的图片”,白色不是最重要的信息,动物才是图片中起决定性的信息。把握好图片中层次化的信息,能够快速的定位到图片中哪部 分信息是起决定作用的,让算法以自适应的方式去关注比较重要的地方或内容,这样就容易捕捉样本之间的关系。2)盘古CV首次兼顾了图像判别与生成能力,能同时满足底层图像处理与高层语义的理解需求,同时能够融合行业知识的微调,快速适配各种下游任务。 提升学习效率,在ImageNet上小样本学习能力上的业界第一。为了解决模型大,数据多带来的学习效率低,表征性能弱的问题,盘古CV大模型在预训练阶段主要集中在 数据处理、架构设计和模型优化三个阶段进行优化。目前盘古CV大模型在ImageNet1%、10%数据集上的小样本分类精度上均达到目前业界最高水平。 图表4:盘古CV大模型 资料来源:华为云官网,国盛证券研究所 3)盘古科学计算大模型:盘古气象大模型提供秒级天气预报,例如重力势、湿度、风速、温度,气压等变量的1小时-7天预测。借助创新的3DEST网络结构以及分层时间 聚合算法,盘古气象大模型在气象预报的关键要素(例如,重力势、湿度、风速、温度等)和常用时间范围上(从一个小时到一周)精度均超过当前最先进的预报方法,同时速度相比传统方法提升1000倍以上。同时,盘古气象大模型支持广泛的下游预报方案, 如在台风路径预测任务上,相比传统数值气象预报方法,盘古气象大模型可以降低20% 以上的位置误差。 图表5:盘古气象大模型 资料来源:华为云官网,国盛证券研究所 4)多模态大模型:紫东.太初是中科院自动化所与MindSpore社区联合打造的全球首个图、文、音三模态大模型,于2021年9月发布。紫东太初大模型首次实现语音生成视频功能,开拓性地实现了图-文-音语义统一表达,同时兼具跨模态理解和生成能力。 图表6:华为携手科研院所推出全球首个图文音三模态千亿大模型 资料来源:mindspore官网,国盛证券研究所 紫东.太初将文本+视觉+语音各个模型高效协同,实现超强性能,在图文跨模态理解与生成性能上都能领先目前业界的SOTA模型,高效完成跨模态检测、视觉问答、语义描 述等下游任务。模型的视频理解与描述性能在2021年ACMMultimedia(国际多媒体大会)和ICCV(国际计算机视觉大会)两项人工智能领域国际顶会的视频语义理解与视频描述中均展现出当前最高水准。 图表7:紫东太初的视频理解与描述性能获得顶会冠军 资料来源:中科院自动化研究所官网,国盛证券研究所 华为盘古大模型为人工智能的行业实践提供牵引,加速行业应用的孵化与创新:华为云盘古预训练大模型已完成从学术大模型到产业大模型的转变,形成了“基础大模型-行业大模型-细分场景大模型”的发展路径,并且在能源、金融、医疗、煤矿、农业、气象等 领域中实现降本增效。 国家电网无人机电力巡检:基于盘古CV大模型的智能缺陷识别,视觉预训练大模型助力下游缺陷识别,进一步提升巡检效果,缺陷样本标注代价减少85%,平均精度提升18%。 浦发银行浦慧云仓:盘古CV大模型1个模型覆盖9种物流场景,监测收货、入库、在库和出库全流程。9种场景差异较大,大模型具备较强泛化能力(例如一个模型同时做行为异常,轨迹异常检测)。异常样本种类多、数量少,大模型可利用小样本数据取得高精准度结果。(异常行为数据大多数呈中长尾分布)利用大模型的时空对齐能力,综合多摄像头数据,解决局部遮挡等问题,准确估计物体轨迹。 广发证券企业财务智能预警:2019年有496家企业被监管处罚、问询或被ST处理,利用盘古大模型预测出其中439家,覆盖率近90%,其中被监管处罚企业111家,盘古大模型全部命中,无一家遗漏。 药物研发:华为云盘古药物分子大模型学习了17亿个小分子的化学结构,在无监督学习模式和业界独有的“图-序列不对称条件自编码器”深度学习网络架构下,更好地对分子结构与性质进行预测与