2024年01月17日 电子 AI浪潮势不可挡,昇腾发力铸造国产算力基石 行业专题 证券研究报告投资评级领先大市-A维持评级 从“性能指标”到“性能密度指标”,海外高端芯片进口受限范围扩大: 2023年10月17日,美国商务部出台了出口管制清单的ECNN3A090和4A090要求,以进一步限制高性能AI芯片的出口,同时将13家中国公司列入实体清单。在新规发布之前,超过旧规性能指标限制的芯片仅为英伟达A100,但当加入性能密度指标后,新规不仅限制了厂商出略低于性能标准的芯片以规避限制情况,同时针对数据中心芯片与非数据中心芯片进行了不同的限制约定,使更多的英伟达芯片受到禁令限制。修改后的出国管制设计产品包括但不限于:英伟达A100、A800、H100、H800、L40、L40S以及RTX4090产品。实际上,任何集成了一个或多个及以上的芯片的系统,包括但不限于英伟达DGX、HGX系统,都在新规涵盖范围之内。 全球科技巨头纷纷布局算力芯片,AI浪潮势不可挡: AMD推出的“MI系列+InfinityFabric+ROCm平台”,性能强劲,成为英伟达全球范围内最强劲的对手。特斯拉自研Dojo超算服务器助力自动驾驶,在芯片间互连技术上独具特色,具备强大的扩展性。Intel推出GPU系列芯片和oneAPI开发平台,不断完善其AI数据中心布局。Google推出CloudTPU解决方案,在机器学习领域。Meta布局自研AI生态,2020年正式推出第一代MTIA方案,侧重于处理低/中复杂度模型。英伟达在GPU领域深耕数十年,根据JonPeddieResearch(JPR)报告显示,2023年Q1,英伟达GPU市场份额达到84%,Q2达到80%,但全球各大科技巨头结合其自身优势纷纷布局算力芯片。 完整的芯片生态“软件+硬件”缺一不可,华为推出全系列昇腾解决方案: 一个完整的芯片生态中仅有硬件芯片是不够的,软件系统开发的便捷性以及现有系统的迁移难度同样至关重要。现阶段英伟达通过其“芯片+NVLINK+CUDA”构建产品高护城河,在GPU市场长期占据全球市场领导地位。华为推出全系列昇腾解决方案,包括自研的昇腾芯片+高速芯片间接口+AI计算架构,从软硬件上和主流厂商对标,昇腾芯片基于自研的达芬奇架构,功耗低,产品性能优异,从官方披露的数据来看,2019年推出的昇腾910,在半精度FP16运算速度可达 首选股票目标价(元)评级 电子 沪深300 38% 28% 18% 8% -2% -12% -22% 2023-012023-052023-092024-01 行业表现 资料来源:Wind资讯 升幅% 1M 3M 12M 相对收益 -7.9 -0.3 9.4 绝对收益 -11.2 -11.6 -12.6 马良 分析师 SAC执业证书编号:S1450518060001 maliang2@essence.com.cn 朱思分析师 SAC执业证书编号:S1450523090002 zhusi1@essence.com.cn 相关报告CES展会新品纷呈,AI与显 2024-01-14 示交互成为焦点高端国产替代系列--光刻 2024-01-10 胶:半导体制造核心材料,国产替代突围在即高通推出第二代骁龙XR2+ 2024-01-07 平台,原生鸿蒙生态有望迎来快速发展华为、小米新车相继发布, 2024-01-01 全球首款商务AIPC亮相苹果MR发售在即,美光业绩 2023-12-24 超预期 320TFLOPS,整型INT8算力可达640TOPS,英伟达A100的FP16运算性能为312TFLOPS。 相关公司:兴森科技、新益昌、天承科技、德邦科技、华海诚科、英维克、飞荣达、思泉新材、恒铭达、华丰科技、沪电股份、世运电路、胜宏科技、方正科技。 风险提示:宏观因素波动影响下游需求;市场开拓不及预期;行业竞争加剧; 内容目录 1.美国加强限制规则,海外高性能芯片进口受限6 1.1.从“性能指标”到“性能密度指标”,英伟达高端芯片进口受限范围扩大6 1.2.人工智能大势所趋,各地政策推进实施7 2.构建完整的芯片生态系统,“硬件+软件”缺一不可8 3.华为昇腾软硬件全面布局,构建国产AI算力基石11 3.1.昇腾生态包括全栈的AI计算基础设施、行业应用及服务11 3.2.基于“自研芯片+自研接口+自研软件生态”,华为推出全系列解决方案14 4.科技巨头纷纷布局算力芯片,AI浪潮势不可挡18 4.1.AMD的“MI系列+InfinityFabric+ROCm平台”,成为英伟达全球范围内最强劲的对手18 4.2.特斯拉自研Dojo超算服务器,芯片间高带宽互连为其一大特色20 4.3.Intel推出GPU系列芯片和oneAPI开发平台,完善其AI数据中心布局21 4.4.Google推出CloudTPU解决方案,更专注于机器学习领域22 5.AI产业带动国内算力数据中心建设,大规模招标陆续启动25 6.相关公司28 6.1.兴森科技28 6.2.新益昌28 6.3.天承科技29 6.4.德邦科技29 6.5.华海诚科30 6.6.英维克31 6.7.飞荣达31 6.8.思泉新材32 6.9.恒铭达33 6.10.华丰科技33 6.11.飞荣达34 6.12.世运电路34 6.13.方正科技:35 7.风险提示36 7.1.宏观因素波动影响下游需求36 7.2.市场开拓不及预期36 7.3.行业竞争加剧36 图表目录 图1.“CPU+GPU+DPU”三芯布局8 图2.GraceHopper架构8 图3.NVLink与PCIE带宽对比10 图4.NVLink版本迭代10 图5.CUDA架构10 图6.昇腾生态全景12 图7.CANN生态14 图8.Atlas900AI集群17 图9.AMDROCm软件堆栈框架19 图10.特斯拉Dojo的整体算力规模将达到100EFLOPs21 图11.Dojo未来路线图21 图12.英特尔®至强产品的路线图22 图13.英特尔数据中心GPUmax系列参数22 图14.OneAPI架构22 图15.TPUv5e芯片互联效率提升23 图16.TensorFlow详细架构24 图17.MITAV124 图18.MTIA的深度学习推荐模型(DLRM)端到端性能结果24 图19.AIRSC与基于V100的集群的运算速度对比25 图20.RSC计算性能25 图21.2022年中国人工智能芯片规模占比25 图22.2023-2024中国电信AI算力服务器集采中标候选人表26 图23.兴森科技营收及同比增速28 图24.兴森科技归母净利润及同比增速28 图25.新益昌营收及同比增速29 图26.新益昌归母净利润及同比增速29 图27.天承科技营收及同比增长29 图28.德邦科技营收及同比增速(单位:亿元)30 图29.德邦科技归母净利润及同比增速(单位:亿元)30 图30.华海诚科营收及同比增速(单位:亿元)30 图31.华海诚科归母净利润及同比增速(单位:亿元)30 图32.英维克营收及同比增速(单位:亿元)31 图33.英维克归母净利润及同比增速(单位:亿元)31 图34.飞荣达营收及同比增速(单位:亿元)32 图35.飞荣达归母净利润及同比增速(单位:亿元)32 图36.思泉新材营收及同比增速(单位:亿元)32 图37.思泉新材归母净利润及同比增速(单位:亿元)32 图38.恒铭达营收及同比增速(单位:亿元)33 图39.恒铭达归母净利润及同比增速(单位:亿元)33 图40.华丰科技营收及同比增速33 图41.华丰科技归母净利润及利润率情况33 图42.飞荣达营收及同比增速(单位:亿元)34 图43.飞荣达归母净利润及同比增速(单位:亿元)34 图44.世运电路营收及同比增速(单位:亿元)35 图45.世运电路归母净利润及同比增速(单位:亿元)35 图46.方正科技PCB销量及同比变化35 图47.方正科技营收及同比增速35 表1:限制法令变化6 表2:英伟达芯片受限情况7 表3:《行动计划》概览8 表4:英伟达GPU迭代9 表5:H100,A100,H800,A800对比9 表6:英伟达产品概览11 表7:昇腾系列处理器算力详情12 表8:昇腾系列与英伟达系列功耗对比13 表9:HCCS接口与NVLink、PCIe5.0对比13 表10:Atlas200DK开发者套件硬件规格15 表11:Atlas300T训练卡(型号9000)硬件规格15 表12:Atlas300I推理卡(型号3000)硬件规格16 表13:Atlas800训练服务器规格16 表14:Atlas800推理服务器硬件规格17 表15:AMDRedeonInstinct系列产品迭代18 表16:AMDRedeonInstinctMI300X对比NVIDIAH100SXM19 表17:AMD相关软件生态19 表18:DojoExaPOD算力在BF16/FP32精度下可达1.1ExaFLOPs20 表19:DojoExaPOD算力在BF16/FP32精度下可达1.1ExaFLOPs21 表20:GoogleTPUv5e对比NVIDIAH100SXM23 表21:GoogleTPUv5e对比NVIDIAH100SXM23 表22:各厂商芯片性能对比26 表23:中国电信此次AI服务器集4个标包情况27 1.美国加强限制规则,海外高性能芯片进口受限 1.1.从“性能指标”到“性能密度指标”,英伟达高端芯片进口受限范围扩大 2023年10月17日,美国商务部出台了出口管制清单的ECNN3A090和4A090要求,以进一步限制高性能AI芯片的出口,同时将13家中国公司列入实体清单。修改后的出国管制设计产品包括但不限于:英伟达A100、A800、H100、H800、L40、L40S以及RTX4090产品。实际上,任何集成了一个或多个及以上的芯片的系统,包括但不限于英伟达DGX、HGX系统,都在新规涵盖范围之内。 此前,2022年8月26日,美国政府要求英伟达停止向中国(包括中国香港)出口两款用于人工智能发展的高端计算芯片,涉及英伟达A100和H100两款芯片,以及未来推出峰值性能等同或超过A100的其他芯片。同时,英伟达应用这些高性能芯片的系统级产品也均在新的管制范围内。2022年9月1日,英伟达发布声明称美国政府允许英伟达在2023年9月1日前,通过公司的香港工厂履行A100和H100的订单和物流运输,但售卖给中国的终端客户仍需要受美国政府批准。 表1:限制法令变化 内容2022年10月7日2023年10月17日新规 性能指标限制每次运算位长乘以TOPS为单位的处理性能不能大于4800增加性能密度指标,同时限制总处理性能与性能密度 限制主体拒绝英伟达向中国出口、转让的申请扩大限制范围,不仅包括大陆与澳门特别行政区,还包 括母公司设置在中国大陆以及澳门特别行政区的实体 资料来源:《对向中国出口的先进计算和半导体制造物项实施新的出口管制》(2022),《先进计算芯片更新规则》及《半导体制造物项更新规则》 (2023),国投证券研究中心 限制强度加大,新增多款芯片受到新规限制。根据英伟达主要芯片规格,可以计算每种芯片的性能密度指标。在新规发布之前,超过旧规性能指标限制的芯片仅为英伟达A100,但当加入性能密度指标后,新规不仅限制了厂商出略低于性能标准的芯片以规避限制情况,同时针对数据中心芯片与非数据中心芯片进行了不同的限制约定,使更多的英伟达芯片受到禁令限制。 表2:英伟达芯片受限情况 型号 算力性能及性能密度 备注 A100 性能指标TPP>4800,性能密度指标>5.92 受到新规旧规双重限制 H100 性能指标TPP>4800,性能密度指标>5.92 受到新规限制 A800 性能指标TPP>4800,性能密度指标>5.92 受到新规限制 H800 性能指标TPP>4800,性能密度指标>5.92 受到新规限制