您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国金证券]:计算机行业专题研究报告:盘古开天,AI落地 - 发现报告
当前位置:首页/行业研究/报告详情/

计算机行业专题研究报告:盘古开天,AI落地

信息技术2023-04-12孟灿国金证券持***
AI智能总结
查看更多
计算机行业专题研究报告:盘古开天,AI落地

单击或点击此处输入文字。 行业观点 应用场景纷繁复杂叠加“作坊式”的开发模式导致传统AI模型商业化落地较难。传统的AI开发模式下,一个场景对 应一个模型,数据质量差、样本少,模型精度差,并且应用场景相对单一。不同行业、不同场景对AI的需求既复杂且碎片化,每个痛点都需要进行定制化地开发和改造;另一方面,AI算法从理论上能够极大提升产品及服务的价值量,但由于开发过程中存在大量的碎片化因素,不同的应用场景往往需要独立的架构设计与调参,效率相对较低。“小作坊式”的AI开发模式在一定程度上限制了生产力。 五个基础大模型涵盖不同方向,三层进化路径打造“实干模式”大模型。盘古大模型进化路径可分为L0-L1-L2三个 阶段,L0基础大模型包括业界首个千亿级生成与理解中文NLP(中文语言)大模型、包含30亿+参数的CV(视觉)大模型、具备跨模态理解、检索与生成能力的多模态大模型、致力于解决各种科学问题的科学计算大模型以及采用图网络融合技术的Graph(图网络)大模型。L1是在L0基础上导入行业数据进行训练后衍生出的行业大模型,L2是在L1基础上结合行业细分场景得到的推理模型,上层是在下层的基础上演化而来,层层递进,确保了在真实产业场景中的效率和适用能力。此外,一站式AI开发平台ModelArts为盘古大模型的训练和推理提供了计算优化、通信优化、存储优化以及算法优化,是盘古大模型重要的基础平台资源。 盘古大模型具备极强的泛化能力,适用大量复杂行业场景。盘古NLP大模型学习了40TB的中文文本数据,CV大模型 包含了30亿+参数,并通过行业数据的小样本调优,提升了模型在场景中的应用性能,提高了大模型的泛化能力以及算法对新鲜样本的适应能力,节省了80%以上的人力标注代价。此外,基于产业场景中存在大量的内容理解需求,盘古大模型采用兼顾架构,在预训练阶段沉淀了大量的通用知识,能够同时完成理解与生成任务,使得大模型有能力支持行业知识库和数据库的嵌入,对接行业经验。盘古大模型相当于各个行业AI通用的“轮子”,助力各行各业加速智能化转型。 预训练+下游微调的工业化AI开发模式赋能千行百业。盘古大模型是一种工业化AI开发的新模式,可以解决小模型 的定制化难题,使一个模型应用到多个场景中。盘古CV大模型首次兼顾了图像判别与生成能力,能同时满足底层图像处理与高层语义的理解需求,同时能够融合行业知识的微调,快速适配各种下游任务。此外,盘古CV大模型在预训练阶段主要集中在数据处理、架构设计和模型优化三个阶段进行优化,目前盘古CV大模型在ImageNet1%、10%数据集的小样本分类精度上均达到目前业界最高水平,工业化AI开发模式有望助力各行各业加速智能化转型。 投资建议 我们重点推荐华为生态链优秀公司神州数码、麒麟信安、易华录、航天宏图、万达信息等。 风险提示 研发投入不及预期、AI应用场景落地进度低于预期、国内外大模型竞争加剧。 内容目录 1.盘古大模型的优势体现在哪里?6 1.130亿参数CV模型+千亿级NLP大模型业界领先6 1.2泛化能力极强、适用大量复杂行业场景9 1.3工业化AI开发模式赋能千行百业10 2.盘古初上,百业AI将兴11 2.1盘古CV大模型:聚焦分类、分割、检测等视觉场景11 2.2盘古NLP大模型:聚焦文本生成与内容理解14 2.3盘古科学计算大模型:致力于解决科学计算问题15 2.4盘古多模态大模型:聚焦跨模态理解、检索与生成17 3.投资建议17 3.1神州数码:IT分销龙头17 3.2麒麟信安:国产操作系统主力军20 3.3中国软件:软件行业国家队22 3.4诚迈科技:领先的操作系统专家24 3.5海量数据:国产数据库领航企业25 3.6易华录:数字经济基础设施建设和运营商28 3.7航天宏图:空天信息领域领军,全产业布局29 3.8万达信息:智慧城市信息服务领先者31 3.9常山北明:常山云建设者,华为核心战略伙伴32 3.10拓维信息:华为全栈IT产业链合作伙伴34 图表目录 图表1:盘古NLP大模型位列CLUE榜单总排行榜第一6 图表2:盘古基础大模型包括五大类模型7 图表3:盘古大模型进化路径可分为L0-L1-L2三个阶段8 图表4:ModelArts为盘古大模型训练和推理提供计算优化、通信优化、存储优化以及算法优化9 图表5:盘古NLP大模型具备较强的泛化能力10 图表6:盘古CV工作流工作模式10 图表7:盘古大模型已广泛应用于众多行业及领域11 图表8:盘古矿山大模型助力煤矿场景智能化12 图表9:基于盘古行业预训练模型的铁路TFDS开发方案13 图表10:盘古大模型助力浦发银行打造“物的”银行13 图表11:循环智能“盘古”NLP平台全景图14 图表12:盘古大模型团队荣获中国法律智能技术评测类案检索赛道第一15 图表13:盘古药物分子大模型在20余项药物发现任务上实现性能最优(SOTA)16 图表14:盘古气象大模型能大幅提升预测速度与精度16 图表15:盘古大模型全球台风预测准确率达到90%16 图表16:盘古大模型显著提升空气质量预测精度17 图表17:盘古多模态大模型支持批量生成符合要求的服饰图片17 图表18:建议关注公司18 图表19:神州数码业务矩阵18 图表20:神州数码基于“鲲鹏+昇腾”打造全线“神州鲲泰”产品体系19 图表21:2022年神州数码收入端有所下降19 图表22:2022年神州数码利润端高速增长19 图表23:2022年神州数码毛利率有所提升20 图表24:神州数码研发费用率持续提升20 图表25:麒麟信安三位一体产品体系20 图表26:麒麟信安携手华为欧拉共筑国产操作系统新生态21 图表27:麒麟信安收入端保持快速增长21 图表28:麒麟信安利润端快速放量21 图表29:麒麟信安毛利率整体上有所下滑22 图表30:麒麟信安费用端管控能力较强22 图表31:中国软件产品体系图22 图表32:银河麒麟操作系统V10基于openEuler开源技术路线23 图表33:中国软件营业收入快速增长23 图表34:近年来中国软件净利润逐年提升23 图表35:中国软件毛利率和净利率整体呈下降趋势24 图表36:中国软件2021年费用率有所上升24 图表37:诚迈科技产品体系24 图表38:统信软件积极助力CentOS迁移改造25 图表39:诚迈科技营业收入逐年提升25 图表40:诚迈科技净利润有所下滑25 图表41:诚迈科技毛利率和净利率有所下滑25 图表42:2021年诚迈科技研发费用率有所提升25 图表43:海量数据核心产品26 图表44:海量数据具备基于openGauss内核的数据库核心技术27 图表45:2022年前三季度收入受疫情影响有所下降27 图表46:费用端投入较大导致净利润承压27 图表47:业务结构转型带动毛利率提升28 图表48:海量数据费用端呈现持续上升趋势28 图表49:易华录热门产品与解决方案28 图表50:交通路口秩序管理一体机应用流程29 图表51:易华录收入有所下滑29 图表52:易华录2021年净利润下降较大29 图表53:易华录2022年前三季度毛利率有所提升29 图表54:易华录费用率整体呈现上升趋势29 图表55:航天宏图三条产品线并行30 图表56:航天宏图基于昇腾AI打造耕地保护智能监测新场景30 图表57:收入端保持增长态势31 图表58:利润端持续高增长31 图表59:毛利率水平维持在50%左右31 图表60:航天宏图高度重视销售体系的建设31 图表61:万达信息“3+2”业务架构32 图表62:万达信息营业收入稳步增长32 图表63:万达信息净利润2021年实现扭亏为盈32 图表64:万达信息毛利率和净利率有所改善32 图表65:万达信息费用管控能力持续向好32 图表66:常山北明三大业务布局33 图表67:北明软件携手华为深耕智慧城市解决方案33 图表68:常山北明营业收入稳定增长34 图表69:常山北明2022年前三季度利润受疫情影响较大34 图表70:常山北明毛利率和净利率稳定增长34 图表71:常山北明研发费用率持续提升34 图表72:拓维信息主要产品34 图表73:拓维信息深度绑定华为云服务35 图表74:拓维信息营业收入快速增长35 图表75:近年来拓维信息净利润增速保持在70%以上35 图表76:拓维信息净利率不断提升36 图表77:拓维信息费用端管控效果显著36 1.盘古大模型的优势体现在哪里? 应用场景纷繁复杂叠加“作坊式”的开发模式导致传统AI模型商业化落地较难,具体来看: 一方面,传统的AI开发模式下,一个场景对应一个模型,数据质量差、样本少,模型精度差,并且应用场景相对单一。不同行业、不同场景对AI的需求既复杂且碎片化,每个痛点都需要进行定制化地开发和改造,同时AI人才相对稀缺,很多企业通过人工进行AI应用的开发,从而导致成本高、效率低、落地慢,投入产出不成正比。此外一旦应用场景发生变化,整个模型可能需要重新开发。 另一方面,“作坊式”开发模式限制了AI生产力的释放。传统的AI开发模式效率相对较低,AI技术的企业渗透率仅在4%左右,AI算法从理论上能够极大提升产品及服务的价值量,但由于开发过程中存在大量的碎片化因素,不同的应用场景往往需要独立的架构设计与调参,效率相对较低。“小作坊式”的AI开发模式无法实现规模化应用,AI生产力受到了一定程度的限制。 1.130亿参数CV模型+千亿级NLP大模型业界领先 盘古大模型从2020年启动研发,2021年4月正式发布,到2022年聚焦行业应用落地,其进化路径可分为L0-L1-L2三个阶段,上层是在下层的基础上演化而来。L0是指基础大模型,包括NLP(中文语言)大模型、CV(视觉)大模型、多模态大模型、科学计算大模型以及Graph(图网络)大模型。 自然语言处理(NLP)系列是业界首个千亿级生成与理解中文NLP大模型,由华为云、循环智能和鹏城实验室联合开发,在训练过程中使用了40TB的中文文本数据,其中包含大量的通用知识与行业经验,具备领先的语言理解和模型生成能力,并通过行业数据的小样本调优提升模型在场景中的应用性能。在中文语言理解评测基准CLUE榜单中,盘古NLP大模型在总排行榜及分类、阅读理解单项均排名第一,刷新了三项榜单世界历史纪录,总排行榜得分83.046(人类水平为85.61),多项子任务得分业界领先。在NLPCC2018文本摘要任务中,盘古NLP大模型取得了Rouge平均分0.53的业界最佳成绩,超越第二名百分之六十。此外,基于提示调优、动态冰化等一系列正则化技术,NLP大模型还实现了小样本学习任务超越GPT系列。 图表1:盘古NLP大模型位列CLUE榜单总排行榜第一 来源:华为云微信公众号,国金证券研究所 计算机视觉(CV)系列为业界最大的CV模型。其包含30亿+参数,在业界首次实现了模型的按需抽取,可以在不同部署场景下抽取出不同大小的模型,动态范围可根据需求覆盖特定的小场景到综合性的复杂大场景,实现了在ImageNet上小样本学习能力业界第一。盘古CV大模型致力于解决AI工程难以泛化和复制的问题,使得研发成本降低90%。此外,盘古CV大模型提供模型预训练、微调、部署和迭代的功能,形成了AI开发完整闭环,极大提升了AI开发效率。CV(视觉)大模型已成功应用在铁路巡检、国家电力巡检等场景。华为南方工厂的PCB版质检即借助了盘古CV(视觉)大模型进行展开,目前正被更多制造企业应用在工业质检环节。 科学计算大模型主要解决各种科学问题,如气象预报、海浪预测、分子动力学预测、微分方程求解等,旨在利用AI促进基础科学的发展。 多模态大模型具备图像和文本的跨模态理解、检索与生成能力,通过跨模态语义关联实现视觉-文本-语音多模态统一表示,采用一个大模型即可灵活支撑图-文-音全场景AI应用,可用于产品设计、艺术创作、语音播报、海报创作等领域。 Graph(图网络)大模型首创图网络融合技术,在工艺优化、时序预测、智能分析