您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华西证券]:计算机行业:美计划加紧对华芯片出口,华为领衔演绎国产崛起 - 发现报告
当前位置:首页/行业研究/报告详情/

计算机行业:美计划加紧对华芯片出口,华为领衔演绎国产崛起

信息技术2023-10-19刘泽晶华西证券
计算机行业:美计划加紧对华芯片出口,华为领衔演绎国产崛起

仅供机构投资者使用证券研究报告|行业动态报告 2023年10月19日 美计划加紧对华芯片出口,华为领衔演绎国产崛起 评级及分析师信息 行业评级:推荐 行业走势图 43%31%19% 7% -6% -18% 2022/072022/102023/012023/042023/07 计算机沪深300 分析师:刘泽晶邮箱:liuzj1@hx168.com.cnSACNO:S1120520020002 计算机行业 美计划加紧对华芯片出口,华为领衔演绎国产崛起 根据新浪新闻的消息,拜登政府计划阻止英伟达等出口高性能AI芯片:根据最新的规则,英伟达包括A800和H800在内的芯片对华出口都将受到影响。这些限制还将影响AMD和英特尔等公司向中国销售的芯片,包括应用材料公司、泛林集团和KLA等芯片设备厂商也受牵连。此外,增加了两家中国实体及其子公司(共计13家参与先进计算芯片开发的实体),为这些公司制造芯片就需要BIS的许可。 华为——全球AI算力的第二极 华为作为国产计算之光正实现0-1的国产突破,其在算力方面,昇腾910芯片单卡算力已经可以与英伟达A100相媲美;统一达芬奇架构助力AI计算引擎;HCCS互联技术,实现卡间高速互联。全连接大会上,华为发布多款AI产品,为世界AI算力第二选择。华为Atlas900SuperCluster、全新的华为星河AI智算交换机亮相,打开国产算力集群想象空间,同时发布“三力四总线”,打造智能世界数字基础大设施,此外发布星河AI网络解决方案,以高运力释放AI时代的高算力。 华为可为客户提供多种算力供给模式,满足行业客户的差异化需求。此外,华为围绕鲲鹏+昇腾构建了良好的生态伙伴社群。从信创到AI,国产服务器需求火爆。近期,中国电信公布采购中标目录,从中国电信采购项目中标人披露来看,非国产服务器中标金额为57亿元,国产G系列中标金额为28亿元,国产服务器的份额和比重显著增加,此外我们判断,下游客户一般按年度制定预算计划,下半年有望进入信创订单释放期。我们判断,信创国产服务器占运营商招标比重正逐年增加,此外,我们判断中国电信成为运营商行业信创落地的前奏信号,相关运营商信创招标有望落地加速。 投资建议: 受益标的: 国产华为系服务器:神州数码、拓维信息、四川长虹、高新发展、天源迪科、中国长城等; 国产芯片:海光信息、景嘉微等; 电源:泰嘉股份、杰华特、欧陆通、中国长城等。 请仔细阅读在本报告尾部的重要法律声明 风险提示 核心技术水平升级不及预期的风险,AI伦理风险,政策推进不及预期的风险,中美贸易摩擦升级的风险。 正文目录 1.美计划加紧对华芯片出口,华为领衔演绎国产崛起4 1.1.拜登政府计划阻止英伟达等出口高性能AI芯片4 1.2.华为——全球AI算力的第二极5 2.投资建议10 3.风险提示11 图表目录 图表1英伟达芯片示意图4 图表2英伟达与华为参数比对4 图表3被新列入“实体清单”的13家中国企业名单5 图表4鲲鹏芯片产品体系演进5 图表5鲲鹏全栈开放,使能全产业伙伴创新5 图表6昇腾计算全产业链6 图表7构筑智能世界的基石6 图表8计算单元示意图6 图表9华为昇腾AI芯片架构图6 图表10HCCS互联拓扑图(K0-K3为鲲鹏处理器)7 图表11昇腾AI集群组网要求7 图表12OceanStorDorado示意图8 图表13华为CloudEngine16800系列数据中心8 图表14华为星河AI网络解决方案示意图8 图表15华为星河AI组网特征8 图表16华为Atlas全系列产品9 图表17华为AI服务器产品参数9 图表18华为昇腾整机硬件生态伙伴9 图表19中信银行通用基础设施集采项目具体产品9 图表20训练型风冷服务器(I系列)10 图表21训练型液冷服务器(I系列)10 图表22训练型风冷服务器(G系列)10 图表23训练型液冷服务器(G系列)10 1.美计划加紧对华芯片出口,华为领衔演绎国产崛起 1.1.拜登政府计划阻止英伟达等出口高性能AI芯片 根据新浪新闻的消息,拜登政府计划阻止英伟达等出口高性能AI芯片:拜登政府10月17日更新了针对人工智能(AI)芯片的出口管制规定,计划阻止英伟达等公司向中国出口先进的AI芯片。根据最新的规则,英伟达包括A800和H800在内的芯片对华出口都将受到影响,新规将在向公众征求30天意见后生效。 图表1英伟达芯片示意图图表2英伟达与华为参数比对 资料来源:IT之家,华西证券研究所资料来源:昇腾官网,英伟达官网,华西证券研究所 这些限制还将影响AMD和英特尔等公司向中国销售的芯片,包括应用材料公司、泛林集团和KLA等芯片设备厂商也受牵连。这是由于新措施扩大了向中国以外的40多个国家出口先进芯片的许可要求,并对中国以外的21个国家提出了芯片制造工具的许可要求,扩大了禁止进入这些国家的设备清单。此外,新措施还旨在防止企业通过Chiplet的芯片堆叠技术绕过芯片限制。 第一,此前英伟达A100及H100两款型号限制出口中国后,为中国专供的“阉割版”的A800和H800就是为了符合规定。英特尔同样也针对中国市场,推出了AI芯片Gaudi2,如今看来,企业们又要在新一轮出口禁令下再进行调整应对。 第二,根据21世纪经济网报道,第二个规则是关于扩大半导体制造设备的出口管控,包括强化对美国人才的限制,还增加了需要申请半导体制造设备许可证的国家数量,从中国扩大到美国能够长臂管辖到的21个国家。 第三个规则是把更多公司列入到“实体清单”,增加了两家中国实体及其子公司(共计13家参与先进计算芯片开发的实体),为这些公司制造芯片就需要BIS的许可。被新列入“实体清单”的13家中国企业名单如下图所示,主要包括壁仞科技、摩尔线程等GPU公司。 图表3被新列入“实体清单”的13家中国企业名单 资料来源:21世纪经济网,华西证券研究所 1.2.华为——全球AI算力的第二极 鲲鹏包括服务器和PC机芯片: 芯片端——鲲鹏920面向数据中心,主打低功耗强性能。鲲鹏处理器是华为自主研发的基于ARM架构的企业级系列处理器产品,包含“算、存、传、管、智”五个产品系统体系。 服务器端——打造TaiShan服务器,实现高效能计算。华为还推出基于鲲鹏920的三款ARMTaiShan200服务器,新服务器专为高性能、高效率场景而设计,主要应用于大数据、分布式存储、ARM原生应用等场景。 图表4鲲鹏芯片产品体系演进图表5鲲鹏全栈开放,使能全产业伙伴创新 资料来源:鲲鹏计算产业白皮书,华西证券研究所资料来源:鲲鹏官网,华西证券研究所 全栈全场景AI芯片,构建智能计算架构核心:昇腾910和昇腾310两款AI芯片均使用华为的达芬奇架构,每个AI核心可以在1个周期内完成4096次MAC计算,集成了张量、矢量、标量等多种运算单元,支持多种混合精度计算,支持训练及推理两种场景的数据精度运算。 华为的全栈全场景AI解决方案日臻完善。主要基于昇腾系列处理器和基础软件构建的全栈AI计算基础设施、行业应用及服务,包括昇腾系列芯片、Atlas系列硬件、芯片使能、CANN(异构计算架构)、AI计算框架、应用使能等。 算力是衡量单卡性能的直观指标:参数方面,我们认为昇腾910芯片单卡算力已经可以与英伟达A100相媲美。 图表6昇腾计算全产业链图表7构筑智能世界的基石 资料来源:昇腾官网,华西证券研究所资料来源:鲲鹏官网,华西证券研究所 华为昇腾芯片,统一达芬奇架构助力AI计算引擎。昇腾AI芯片的计算核心主要由AICore构成:AICore采用了达芬奇架构,它包括了三种基础计算资源,矩阵计算单元、向量计算单元和标量计算单元。这三种计算单元分别对应了张量、向量和标量三种常见的计算模式,在实际的计算过程中各司其职,形成了三条独立的执行流水线。我们认为本质上讲昇腾芯片属于专为AI而生的特定域架构芯片。 图表8计算单元示意图图表9华为昇腾AI芯片架构图 资料来源:华为云社区,华西证券研究所资料来源:华为云社区,华西证券研究所 华为HCCS互联技术,实现卡间高速互联。HCCS是华为自研的高速互联接口,片内RoCE可用于节点间直接互联。HCCS是HCCL的硬件形态,HCCL提供了深度学习训练场景中服务器间高性能集合通信的功能。每台设备具备两个HCCS环共8颗处理器(A0~A7)。每个HCCS存在4颗处理器,同一HCCS内处理器可做数据交换,不同HCCS内处理器不能通信。单个AI处理器提供3条HCCS互连链路,提供最大 90GB/s带宽能力。NPU载板由4个AI处理器组成,3条HCCS组成一个4PFullmesh互联,4个AI处理器间互联带宽达到30GB/s,双向60GB/s。 我们认为AI大算力集群背景下,单张AI芯片无法完成训练任务,需要联合多张AI芯片,数据传输速率同样重要,华为HCCS互联技术可以实现卡间高速互联,相较于PCIE模式有显著优势,能有效帮助服务器集群协同训练,从而加速AI的训练。 图表10HCCS互联拓扑图(K0-K3为鲲鹏处理器)图表11昇腾AI集群组网要求 资料来源:昇腾官网,华西证券研究所资料来源:昇腾官网,华西证券研究所 华为发布多款产品,助力国产AI生态 1、华为发布全新架构AI集群,支持超万亿参数大模型训练:在华为全联接大会2023上,华为推出全新架构的昇腾AI计算集群——Atlas900SuperCluster。新集群采用了全新的华为星河AI智算交换机CloudEngineXH16800,借助其高密的800GE端口能力,两层交换网络即可实现2250节点(等效于1.8万张卡)超大规模无收敛集群组网。 2、华为发布“三力四总线”,打造智能世界数字基础大设施:华为发布“大算力,大存力,大运力”解决方案,打造领先的AI大模型训练集群:算力方面,华为通过架构和系统创新,构筑面向多场景的大算力平台,突破AI大模型训练的算力瓶颈。存力方面,华为发布领先的AI知识库存储OceanStorA800,以创新架构构建高性能数据存储。运力方面,华为发布业界首款高运力DCN星河AI智算交换机,和业界容量最大的超宽全光智能DCI方案,以大规模,大容量网络运力释放大算力。 图表12OceanStorDorado示意图图表13华为CloudEngine16800系列数据中心 资料来源:华为官网,华西证券研究所资料来源:华为官网,华西证券研究所 3、华为发布星河AI网络解决方案,打造AI时代最强运力:2023年9月20日,华为全联接大会期间,华为分享了对以大算力、大存力、大运力加速AI大模型打造的发展愿景。新一代华为星河AI网络解决方案华为数据通信产品线总裁王雷正式发布星河AI网络解决方案,为加速行业智能化转型提供强劲引擎。华为星河AI网络解决方案,打造AI时代最强运力。 图表14华为星河AI网络解决方案示意图图表15华为星河AI组网特征 资料来源:华为官网,华西证券研究所资料来源:星河AI网络白皮书,华西证券研究所 华为服务器构筑世界AI算力第二选择:华为目前已具备“端、边、云”的产品布局: AI服务器:华为AI服务器分为推理服务器和训练服务器:3000系列和9000系列。训练侧,算力精度要求较高,Atlas800训练服务器(型号:9010)基于Intel处理器+华为昇腾910芯片,具有超强算力密度、高速网络带宽等特点,AI算力可达2.24PFLOPS@FP16。 AI处理器:华为AI处理器有昇腾310和昇腾910两款:910支持全场景人工智能应用,昇腾310主要用在边缘计算等低功耗的领域。与英伟达对比,昇腾910半精度算力(FP16)达320TFLOPS,约为英伟达V100芯片算力 (130TFLOPS)的2.5倍,与英伟达A100算力(312TFLOPS,未采用稀疏技术)水平相当。 图表16华为Atlas全系列产品图表17华为AI服务器产品参数 资料来源:华为官网,华西证券研究所资料来源:华为官网,