自研高算力AI芯片,构建全产业链生态。昇腾计算产业是基于昇腾系列处理器和基础软件构建的全栈AI计算基础设施、行业应用及服务,已发展为包括昇腾系列芯片、硬件、CANN、AI计算框架、应用使能、开发工具链、管理运维工具等全产业链的完整体系。昇腾平台采用“一平台双驱动”模式,坚持“硬件开放,软件开源,使能合作伙伴”战略,截止2023年7月,昇腾已认证了30多家硬件伙伴、1200多家软件伙伴,联合打造了2500多个场景方案。 与300多家高校院所合作,每年培养超过10万名专业AI人才,昇腾开发者突破180万人。 内部:昇腾计算产业架构,软硬件夯实底座。硬件层面,作为ASIC芯片,昇腾系列N一旦契合对应算法和场景,具有高效低成本特点,其中昇腾910在FP16和INT8算力高于英伟达A100。软件层面,昇腾AI产业链以CANN异构计算架构为底座,支持MindSpore自研AI框架以及TensorFlow等第三方框架,同时打造在应用使能平台,助力行业开发者将AI计算融入各行各业,目前已在富士康、中国移动等公司落地。2023年7月,昇腾推出首个万卡AI集群,规模从最初的4000卡集群扩展至16000卡,拥有更快训练速度和稳定训练周期。 外部:联合合作伙伴,打造产业生态。昇腾与鲲鹏(通用计算)、盘古(多模态AI大模型)结合,统合华为人工智能生态。对外,昇腾生态伙伴网络目前已有宝德、华鲲振宇、长江计算、清华同方等合作伙伴。华为通过总经销商供货的销售支持、与总销售商双方的技术支持模式,以及多种商务权益激励,鼓励伙伴基于昇腾AI打造自有品牌的产品或解决方案,实现共赢。目前昇腾开发者社区提供100+种工具与样例和50+种数据集、50+门直播课程和70+门个人课程、20+名专家轮值服务旨在加速昇腾开发者成长、构建昇腾开发者生态。 投资建议:建议关注华为产业链:整机合作伙伴:神州数码、拓维信息、四川长虹、紫光股份;垂直应用合作伙伴:软通动力、赛意信息、东方国信、常山北明、格灵深瞳、云从科技、云天励飞、海量数据、润和软件、智洋创新。 风险提示:AI技术迭代不及预期的风险、商业化落地不及预期的风险、政策监管风险。 1自研高算力AI芯片,构建全产业链生态 昇腾计算产业是基于昇腾系列处理器和基础软件构建的全栈AI计算基础设施、行业应用及服务。2018年10月,华为全联接大会正式发布首款采用华为自研达芬奇架构架构的AI训练芯片昇腾910与AI推理芯片昇腾310,并于2019年正式投入商用。2019年9月,华为推出昇腾AI计算架构,包括昇腾处理器、昇腾AI加速模块和昇腾AI开发环境,初步形成AI计算解决方案。昇腾计算致力于完善AI计算产业生态,以自身软硬件体系为核心,联合制造、设计、集成、开发等软硬件合作伙伴与咨询、运营、人才培养等服务合作伙伴,投入各个行业应用实现生产力升级核心目标。 图1.昇腾计算产业生态 昇腾计算架构由硬件、基础软件、应用使能与行业应用及服务四层构成。昇腾AI应用开发过程以芯片及处理器等硬件为基础,CANN(异构计算框架)承接硬件与计算框架,搭配自有开发与管理工具,联接应用使能以投入具体行业应用。目前昇腾计算产业已发展为包括昇腾系列芯片、硬件、CANN、AI计算框架、应用使能、开发工具链、管理运维工具等全产业链的完整体系。 图2.昇腾计算架构 昇腾平台以软硬件体系为基础,使能产业生态共建。昇腾平台采用“一平台双驱动”模式,其中“一平台”指基础软件平台,包括AI处理器、服务器硬件以及芯片使能软件、AI框架,“双驱动”指平台要支撑的两大生态,即技术生态与商业生态。 坚持“硬件开放,软件开源,使能合作伙伴”战略,聚焦自有计算架构、处理器和基础软件创新研发的同时发展软硬件与使能,共同开拓计算产业蓝海。 图3.昇腾一平台双驱动战略 联合伙伴创新,共筑智能根基。2023年7月6日,在世界人工智能大会WAIC上,华为携手伙伴联合发布昇腾AI大模型训推一体化解决方案,加速大模型在各行业应用落地,并有23家昇腾AI伙伴推出AI服务器、智能边缘与终端新品,共同为行业智能化升级提供丰富的产品与解决方案。截止2023年7月,昇腾已认证了30多家硬件伙伴、1200多家软件伙伴,与300多家高校院所合作,每年培养超过10万名专业AI人才,昇腾开发者突破180万人。 图4.昇腾一体化解决方案发布 图5.华为智能基座育人基地 2内部:昇腾计算产业架构,软硬件夯实底座 2.1硬件开放,高算力AI芯片提供澎湃动力 全球首个覆盖全场景AI芯片,构建昇腾全产业链底座。昇腾系列处理器是基于华为达芬奇架构的神经网络处理器(NPU),包括昇腾310和昇腾910两款针对不同应用领域的芯片: 昇腾310定位为推理处理器,高效、灵活、可编程,能够以最大功率8W达到16位半精度(FP16)8TFLOPS、整数精度(INT8)16TOPS的算力,能效比极高,主要用于智能手机、智能附件等电子终端。 昇腾910定位为训练处理器,高度集成的片上系统在提供高算力的同时可减少与HostCPU的交互,最大功率310W,运算能力可达FP16320TFLOPS、INT8640TOPS,比英伟达A100更高,主要应用于高端服务器和云计算。 表1.昇腾处理器与英伟达A800处理器 量产ASIC高效低成本,独有片上系统结构保障灵活性。昇腾系列NPU属于ASIC(即专用集成电路)的一种。相较于GPU和FPGA等其他类型AI芯片,ASIC具有高度定制化特征,一次流片即定型,可编程性不足,但特定性能、规格、功耗等均显著优于前两者;初期成本高、开发周期长拉高生产进入门槛,但大产量规模可将单片成本压到极低。昇腾系列芯片采用“量产一代、研发一代、规划一代”的投产思路,保障每一代ASIC可用性的同时能够通过大规模生产。并且,昇腾AI芯片设计为SoC(片上系统)类型,即单个芯片上集成了包括数据存储、计算单元等的整个系统,功能全面且支持芯片灵活组合。 图6.昇腾AI芯片结构(昇腾310) 华为自研达芬奇架构形成独特竞争优势,有效提高神经网络运算效率。达芬奇架构是华为自研的面向AI神经网络卷积计算设计的架构,针对矩阵运算进行加速,算力部分由3D Cube矩阵乘法单元、Vector向量计算单元、Scalar标量计算单元三部分提供,共同组合提供并行化多样化算力。独创16*16*16的高密度3DCube使得单个AICore每时钟周期可进行4096个16位半精度浮点MAC计算,而4*4*4结构的英伟达TensorCore单个AI核心仅支持64个。并且,基于其灵活可扩展的特性,达芬奇架构可以通用硬件架构实现从低端到高端的全覆盖,能够满足端边云多侧全场景算力要求。 图7.达芬奇3DCube计算单元 坚持“硬件开放”策略,提供多样化算力选择。昇腾系列硬件基于同一达芬奇架构开发多用途硬件,具有以下特征: 产品针对性强:昇腾系列硬件包括模组、板卡、小站、服务器、集群等丰的产品种类及形态,囊括“云、边、端”全场景Al基础设施方案。以加速卡为例,昇腾提供训练卡、推理卡、视频解析卡三类,分别针对模型训练、边端推理、高强度视频解析等不同需求。 扩展性强:硬件基于统一的达芬奇架构,可灵活高效扩展,Atlas 900 PoD A2集群基础单元最大可拓展至3.2 EFLOPS,且保证全节点200G网络互联。 硬件搭配选择多样化:除提供既有的Atlas系列硬件产品外,华为还将昇腾系列芯片等硬件开放给合作伙伴,让伙伴基于Atlas系列硬件进行集成和二次开发,联合打造有竞争力的产品。 表2.昇腾加速卡产品图 表3.昇腾Atlas系列集群基础单元 液冷技术加码高能效,算力集群大幅扩展。在数据中心侧,更高的能效比可大幅降低数据中心运营成本。Atlas集群作为业界首个全液冷AI集群,采用板级液冷、柜级风液换热器等独特设计,单柜即可支持46kW,16个机柜即可提供256 PFLOPS算力,整个AI集群的PUE小于1.1。在边缘侧,模组能效比可达2 TOPS /W,适应低功耗和边缘部署需求。高能效使得算力集群密度增加成为可能,2023年7月的世界人工智能大会上,华为宣布昇腾AI集群全面升级,推出首个万卡AI集群,规模从最初的4000卡集群扩展至16000卡,拥有更快训练速度和稳定训练周期。 图8.Atlas系列集群基础单元特征 2.2软件开源,简化AI场景开发及行业应用流程 坚持全栈开放,开源开放原则,构建良好AI产业生态。在软件层面,昇腾AI产业链以CANN异构计算架构为底座,支持MindSpore自研AI框架以及TensorFlow等第三方框架,同时打造在应用使能平台,MindX由“2+1+N”(2个组件、1个模型库、N个SDK)组成,助力行业开发者将AI计算融入各行各业,提供不同开发工具和套件,同时满足极简开发和极致性能两方面的需求。 图9.AI集群产品介绍 CANN(异构计算架构):针对AI场景开发,软硬件层面保障全方位兼容。该架构专为深度学习设计,向下使能昇腾处理器的并行加速能力,向上提供统一、多层次编程接口,助力用户快速构建基于昇腾平台的AI应用和业务。CANN分为四层结构,下层实现硬件与操作系统的适配和支持,中层协调内存管理、算力分配和资源调动任务,上层提供多样接口实现高效率开发。该系统具有高兼容性,支持端边云全场景协同,支持10+种设备形态、14+种操作系统及多种计算框架(包括PyTorch、TensorFlow等主流框架),支持向后兼容和演进。 图10.CANN异构计算架构 MindSpore(昇思):支持多处理器架构的全场景开放AI计算框架。MindSpore在动静态图转换、自动并行以及端边云协同等方面做出较大创新;最佳匹配昇腾AI处理器算力,支持端边云全场景灵活部署,降低AI开发门槛,致力于实现开发态友好、运行态高效、全场景按需协同三大目标。MindSpore同样致力于构建良好开源生态,2020年3月28日,华为于开发者大会2020上宣布该架构在码云正式开源。MindSpore与社区合作,目前已覆盖逾1.6万用户,与33所高校开展AI课程、研究合作,提供20多种主流模型,覆盖150多种应用。 图11.昇思MindSpore四大优势 MindStudio:全流程开发工具链,提供全新开发体验。Mindstudio整合了算子开发、模型训练、模型推理、应用开发的所有工具流,提供四大开发体验:1)插件化设计:提供开发接口,用户可自定义工具插件;2)便捷安装:提供安装工具,针对难理解词汇提供实时注释;3)开发辅助:提供语法一键补全功能;4)精准分析服务:可视化调优;提供基于不同维度的蘑菇型精度比对结果。 图12.MindStudio开发流程 MindX:应用使能平台,“2+1+X”助力AI融入千行百业。MindXDL给业界伙伴提供深度学习系统参考架构,MindXEdge实现将云端模型推送至边缘断部署,同时将边缘侧未识别数据上传至云端进行增量训练。ModelZoo将AI开发需要的模型提前挑优并保障精度性能后提供给开发者。SDK作为软件开发套件,凝聚了行业知识,结合AI最佳实践,可以提供给开发者行业所需的算法以及各种推理验证工作,帮助开发者提高开发效率。 图13.MindX应用使能 多样化AI解决方案全方位使能行业应用。昇腾AI市场提供多行业的成熟的AI解决方案,涵盖数字政府、能源、金融、交通、电信、制造、医疗、教育等,同时提供应用案例,按多维分类展示,便于用户查询。昇腾AI为企业提供特定软硬件解决方案,硬件解决方案通常为向企业提供AI服务器算力(如下表案例3和 4),软件解决方案以图像和视频的识别为主(如下表案例1和2),助力企业数值化管理运营、降本增效。 表4.昇腾AI解决方案及案例 3外部:联合合作伙伴,打造产业生态 3.1与鲲鹏处理器、盘古大模型结合,统合华为人工智能生态 鲲鹏展翅,共赢计算新时代。以鲲鹏基础芯片为底座,给予盘古大模型强大支撑。 鲲鹏通用计