行业研究|深度报告 看好(维持) 盘古大模型全新版本即将发布,建议关注华为产业链标的 通信行业 国家/地区中国 行业通信行业 报告发布日期2023年04月04日 核心观点 华为云盘古大模型全新版本即将发布。目前,华为云已推出五大水平领域的基础大模型(L0),分别为:NLP(中文语言)大模型、CV(视觉)大模型、科学计算大 模型、多模态大模型和Graph(图网络)大模型。其中,NLP大模型是业界首个千亿参数的中文预训练大模型,且首次使用Encoder-Decoder架构,兼顾NLP理解与生成的能力;CV大模型为30亿参数的模型,是业界首次实现按需抽取的模型;科学计算大模型主要解决各种科学问题,旨在用AI促进基础科学的发展;多模态大模型具备图像和文本的跨模态理解、检索与生成能力;图网络大模型首创图网络融合技术,在工艺优化、时序预测、智能分析等场景有广泛应用。 华为云盘古大模型自身不断迭代,已实现诸多领域的应用。盘古大模型进化路径可分为L0-L1-L2三个阶段。L0指基础大模型,L1指行业大模型,L2则是指面向更加 细分场景的推理模型。1)基础大模型方面,以图网络大模型为例,一个大模型可以适配工艺优化、时序预测、智能分析等多个场景,同时应用在金融、煤矿、制造等多个行业。2)行业大模型方面,华为云推出了如盘古金融大模型、盘古矿山大模型、盘古电力大模型、盘古制造质检大模型、盘古药物分子大模型等行业大模型。3)推理模型方面,以在电力行业为例,华为云基于盘古电力大模型,针对无人机电力巡检细分场景,通过一次预训练+下游任务的微调,推出盘古电力巡检大模型,解决了无人机智能巡检系统(缺陷检测)中的小样本学习、主动学习、增量学习等问 张颖021-63325888*6085 zhangying1@orientsec.com.cn执业证书编号:S0860514090001香港证监会牌照:BRW773 王婉婷wangwanting@orientsec.com.cn 周天恩zhoutianen@orientsec.com.cn 题,解决了海量数据标注工作量大和缺陷种类繁多的问题。此外,在华为部署的物 联网、智能座舱、智能驾驶等领域,盘古大模型也有望得到应用,为这些领域提供更加智能化的技术支持。 中国联通会议强调加快新型基础设施建设,利好5G/算力建设产业链 运营商持续增持彰显信心,以数智赋能产业 2023-03-16 2023-03-13 “一平台双驱动”,华为盘古打造生态型产业链。华为盘古大模型基于昇腾计算产 业生态。关于AI生态型产业链,华为提出“一平台双驱动”的模式,其中“一平台”指基础软件平台,包括AI处理器、服务器硬件以及芯片使能软件、AI框架。“双驱动”指平台要支撑的两大生态,一是技术生态,二是商业生态,包括ISV (独立软件开发商)、IHV(独立硬件开发商)、整机、一体机合作伙伴等。 投资建议与投资标的 建议关注华为大模型产业链相关的硬件供应商、服务提供商及行业应用合作伙伴: 硬件供应商:1)算力硬件:广电运通(002152,未评级);2)连接器:意华股份 (002897,未评级);3)桌面云终端:星网锐捷(002396,未评级);4)光器件:光迅科技(002281,未评级)、华工科技(000988,未评级) 服务提供商:1)网络规划建设:特发信息(000070,未评级);2)网络管维:润建 股份(002929,未评级);3)IDC建设:光环新网(300383,未评级) 行业应用合作伙伴:1)AI应用:创维数字(000810,未评级);2)华为生态:初灵信息(300250,未评级)、天源迪科(300047,未评级);3)云通信:彩讯股份(300634,未评级)、梦网科技(002123,未评级);4)云计算:光环新网(300383, 未评级) 风险提示 宏观经济下行风险、配套算力基础设施发展较慢、盘古大模型能力不及预期、伦理风险 对标世界一流企业价值,运营商在行动2023-03-06 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 目录 一、华为云盘古大模型全新版本即将发布4 1.1鲲鹏+昇腾搭建基础AI算力5 1.2全场景AI框架:MindSpore7 1.3AI开发平台:ModelArts9 二、从L0到L2,从基础模型到具体场景10 三、投资建议12 3.1创维数字13 3.2初灵信息13 3.3星网锐捷14 3.4广电运通14 3.5特发信息15 3.6意华股份15 3.7光迅科技15 3.8华工科技16 3.9润建股份16 3.10天源迪科16 3.11彩讯股份17 3.12梦网科技17 3.13光环新网17 四、风险提示18 图表目录 图1:华为开发者大会2021发布的盘古大模型4 图2:盘古大模型中三项大模型处于即将上线状态4 图3:盘古NLP大模型架构5 图4:盘古CV大模型架构5 图5:华为以“一云两翼双擎”布局计算产业5 图6:“鲲鹏+昇腾”双引擎5 图7:Atlas全系列产品6 图8:MindSpore超大规模自动并行8 图9:MindSpore在中国AI框架市场中处于第一梯队9 图10:ModelArts架构9 图11:ModelArts六大优势9 图12:华为“1+8+N”战略11 图13:华为发布昇腾大模型沙盘规划12 图14:鹏程·神农加速生物制药筛选过程12 图15:一平台双驱动,打造生态型产业链12 图16:华为大模型产业链13 表1:华为昇腾VS英伟达GPU6 表2:分布式并行分类7 一、华为云盘古大模型全新版本即将发布 盘古初显锋芒。2021年4月,在华为开发者大会上,华为云发布了盘古系列超大规模预训练模型,包括NLP大模型以及CV大模型。目前,华为云已推出五大水平领域的基础大模型(L0),分别为:NLP(中文语言)大模型、CV(视觉)大模型、科学计算大模型、多模态大模型和Graph (图网络)大模型。时隔两年,华为云即将再次上线盘古大模型的全新版本。 1)NLP大模型:由华为云、循环智能与鹏城实验室联合开发,是业界首个千亿参数的中文预训练大模型,并使用了40TB的文本数据用于训练。盘古NLP大模型首次使用Encoder-Decoder架构,兼顾NLP理解与生成的能力,在CLUE榜单上中文理解能力接近人类水平。 2)CV大模型:为30亿参数的模型。盘古CV大模型在业界首次实现了模型的按需抽取,根据不同部署环境的运行要求可以自动抽取出的适合的模型,模型差异动态范围可达三个数量级;提出基于样本相似度的对比学习,在ImageNet数据集上小样本学习能力业界第一。 3)科学计算大模型:主要解决各种科学问题,如气象预报、海浪预测、分子动力学预测、微分方程求解等,旨在用AI促进基础科学的发展。 4)多模态大模型:具备图像和文本的跨模态理解、检索与生成能力,通过跨模态语义关联实现视觉-文本-语音多模态统一表示,采用一个大模型即可灵活支撑图-文-音全场景AI应用,可用于产品设计、艺术创作、语音播报、海报创作等领域。 5)Graph(图网络)大模型:首创图网络融合技术,在工艺优化、时序预测、智能分析等场景有广泛应用,比如预测企业财务风险、制造企业优化工艺等等。 图1:华为开发者大会2021发布的盘古大模型图2:盘古大模型中三项大模型处于即将上线状态 数据来源:IT之家,东方证券研究所数据来源:华为云,东方证券研究所 盘古NLP模型——兼顾生成和理解能力。基于大量的参数,模型能够学会数据之间的关系,抽象出逻辑能力,更加智能化,然而模型的能力并不完全由参数量决定。首先,千亿参数的大模型每优化一次就会耗费巨大的成本,单一的参数量堆积可以帮助大模型更好地理解表征和语义之间的关联性,但所耗费的算力、时间成本也会随之增加,对训练过程中出错的敏感程度亦会上升,牵一发而动全身。因此盘古NLP模型在预训练阶段加入基于prompt的任务,降低微调难度,解决以往大模型为不同行业场景进行微调的困难。在下游数据充足时,微调难度的降低使得模型可以随着数据变多而持续优化;在下游数据稀缺时,微调难度的降低使得模型的少样本学习效果得到显著提升。其次,在模型结构上,跟传统其他企业训练的NLP大模型的方式不同,盘古看重的不仅 是大模型有生成能力,还要有更强的理解能力。华为采用了Encode和Decode的架构,来保证盘古大模型的在生成和理解上面的两个性能。 盘古CV大模型——兼顾图像判别与生成能力。首先,为了解决模型大、数据多带来的学习效率低、表征性能弱的问题,盘古CV大模型在预训练阶段主要集中在数据处理、架构设计和模型优化三个阶段进行优化。以区分白色猫和白色狗的图片为例,显然白色不是最重要的信息,动物才是。基于此,华为进行了算法自研,比如在视觉中强行给模型注入一些层次化信息,让模型在训练过程中了解样例之间真正强关联性的东西。 图3:盘古NLP大模型架构图4:盘古CV大模型架构 数据来源:华为云,东方证券研究所数据来源:华为云,东方证券研究所 除模型本身的优化外,盘古的优异性能还有赖于基础算力设施、AI专用框架与平台的搭建。1)算力:鲲鹏CPU+昇腾GPU提供底层算力支撑,同时还基于华为CANN采用了算子量化、算子融合优化等技术,将单算子性能提升30%以上。 2)全场景AI框架:华为MindSpore创新性地采用了“流水线并行、模型并行和数据并行”的多维自动混合并行技术,大幅降低了手动编码的工作量,并提升集群线性度20%。 3)AI平台:ModelArts平台提供E级算力调度,同时结合物理网络拓扑,提供动态路由规划能力,为大模型训练提供了最优的网络通信能力。 1.1鲲鹏+昇腾搭建基础AI算力 华为以鲲鹏和昇腾作为根基,打造“一云两翼双引擎”的计算产业布局,持续构建开放生态。其中,双引擎指围绕“鲲鹏”与“昇腾”打造的两个基础芯片族,构筑异构的计算架构。华为已成为同时拥有“CPU、NPU、存储控制、网络互连、智能管理”5大关键芯片的厂商。 图5:华为以“一云两翼双擎”布局计算产业图6:“鲲鹏+昇腾”双引擎 数据来源:华为,东方证券研究所数据来源:华为,东方证券研究所 鲲鹏包括服务器和PC机芯片。鲲鹏920是业界首颗64核的数据中心处理器,性能比业界主流处理器高25%、内存带宽高60%;同时把CPU、桥片、网络和磁盘控制器“4合1”。鲲鹏处理器从2007年走到现在已历时16年,鲲鹏920是第三代芯片。华为认为,最强算力的通用服务器需要具备至少64核、8个内存通道、PCIe4.0、多合一SoC、xPU高速互联、100GE高速I/O等六个特征。 昇腾,基于华为自研DaVinci架构的AI处理器,可应用于训练和推理场景;昇腾910训练芯片与英伟达A100算力基本相当,昇腾310推理芯片,功耗仅8W。昇腾计算基于昇腾系列处理器构建的全栈AI计算基础设施及应用,包括昇腾系列芯片、系列硬件、芯片使能、AI框架、应用使能等。华为Atlas人工智能计算解决方案基于昇腾系列AI处理器,通过模块、板块、小站、服务器、 集群等丰富的产品形态,打造面向“端、边、云”的全场景AI基础设施方案,涵盖数据中心解决方案、智能边缘解决方案。 表1:华为昇腾VS英伟达GPU AI加速芯片 算力 功耗 华为昇腾910 640TOPS(INT8), 320TFLOPS(FP16) 310W 英伟达A10080GBPCIe 624TOPS(INT8), 312TFLOPS(FP16) 300W 英伟达H100PCIe 3026TOPS(INT8), 1513TFLOPS(FP16) 300-350W 数据来源:公司官网,东方证券研究所 注:英伟达H100PCIe算力为采用稀疏技术下的算力。 图7:Atlas全系列产品 数据来源:华为官网,东方证券研究所 1.2全场景AI框架