事件:英伟达于8月31日发布公告称,美国政府于8月26日通知公司对其未来出口到中国大陆、中国香港和俄罗斯的A100和即将推出的H100等AI芯片实施许可证要求,该许可证要求同样适用于英伟达未来性能优于A100的产品及相关系统。据路透社报道,AMD也接到相关通知,或将禁止向中国出售MI250芯片。美国政府表示,相关限制主要为防止这些产品被用于军事最终用途或军事最终用户。根据英伟达公告,公司预计受此限令影响,在中国地区的潜在营收损失约为4亿美元。 受限芯片主要应用于AI、HPC、自动驾驶等领域:1)英伟达A100采用Ampere安培架构和 7nm 工艺,搭载厂商包括华硕、Atos、思科、Dell、富士通、HPE、浪潮、联想等,同时还包括阿里巴巴、百度、腾讯、京东等中国互联网客户。下游主要应用于人工智能、数据分析等领域。2)英伟达H100采用Hopper架构和 4nm 工艺、CoWoS 2.5D晶圆级封装。可用于大型AI学习以及云计算中心。 3)AMD MI250采用CDNA2 GPU架构和 6nm 制程。搭载厂商包括华硕、ATOS、Dell、技嘉、HPE、联想等。 我国数据中心建设成本和高精度计算能力将受影响,自动驾驶云端训练短期受冲击较小:英伟达创始人黄仁勋表示将与中国客户合作寻找替代产品或申请许可证,但对需要A100全面性能的客户来说,替代产品性能会不足。1)数据中心,美国对A100等高性能GPU的限制将影响国内阿里云、腾讯云等云厂商高端数据中心的建设。国内云厂商可以使用性能更低的替代产品,并靠堆数量的方法获得同等规模算力,但这将增加计算成本,同时一些高精度计算也会受限。2)自动驾驶,对我国自动驾驶行业短期冲击较小,长期来看或可影响我国自动驾驶软件学习效率。但由于AI训练芯片不会随着终端销售规模的增加而快速消耗,因此短期来看存货足够则可以满足几年内的扩容,短期内受冲击较小。但长期来看,若英伟达高端芯片持续升级,而我国高端芯片持续缺乏,则自动驾驶的云端训练效率将受到影响。 关注国产替代机会,但国产GPU在产品性能与软件生态方面与英伟达仍有一定差距:我们认为美国对高端GPU芯片的禁令将推动GPU芯片的国产替代。目前国内已上市的GPU公司包括航锦科技、海光信息、龙芯中科、景嘉微、寒武纪等;未上市的公司包括壁仞科技、摩尔线程等。1)从产品性能来看,目前国产高端AI芯片的通用性与英伟达相比仍有一定差距,但在某一些维度已经接近或者超过英伟达。比如壁仞科技的壁砺100芯片采用 7nm 先进制程工艺,可提供的峰值计算能力为2048 TOPS@INT8,超过了A100的624 TOPS@INT8。2)从软件生态来看,英伟达的CUDA生态目前也具有较高的壁垒,而用户从CUDA平台迁移具有较高的成本。 风险分析:美方出口管制政策变化的不确定性;国产AI芯片研发进度放缓;高端GPU芯片代工环节受限制的风险 1、美国限制英伟达高端GPU芯片出口,将催化国产GPU替代机会 1.1、此次受限产品为高端GPU芯片,主要应用于AI、HPC、自动驾驶等场景 英伟达于8月31日发布公告称,美国政府于8月26日通知公司对其未来出口到中国大陆、中国香港和俄罗斯的A100和即将推出的H100等AI芯片实施许可证要求,该许可证要求同样适用于英伟达未来性能优于A100的产品及相关系统。 同时据路透社报道,AMD也接到相关通知,或将禁止向中国出售MI250芯片,但AMD认为其MI100芯片不受影响。美国政府表示,相关限制主要为防止这些产品被用于军事最终用途或军事最终用户。 9月1日英伟达再次发布声明表示,美国政府已授权其出口、再出口和国内转让,以继续开发H100芯片;允许公司在2023年3月1日前为A100的美国客户提供必要的出口支持;允许2023年9月1日前公司可通过在中国香港的设施进行A100和H100的订单履行和物流。我们认为美国的相关授权并没有实质性改变,也就是相关芯片售卖给中国客户仍需要美国政府的许可。 根据英伟达公告,公司预计受此限令影响,中国地区的潜在营收损失约为4亿美元。 此次限制的GPU芯片主要应用于HPC、AI训练和推理等场景,属于GPGPU(General Purpose GPU),而其他GPU不受影响: 1)英伟达A100:发布于2020年3月,采用Ampere安培架构以及台积电 7nm 工艺,FP16 312 TFLOPS。搭载厂商包括华硕、Atos、思科、Dell、富士通、HPE、浪潮、联想等,同时还包括阿里巴巴、百度、腾讯、京东等中国互联网客户。下游主要应用于人工智能、数据分析等领域。 2)英伟达H100:发布于2022年3月,于2022年5月上市,采用Hopper架构以及台积电 4nm 工艺、CoWoS 2.5D晶圆级封装。FP16 2000TFlops,三倍于A100,可用于大型AI学习以及云计算中心。 3)AMD MI250:发布于2021年11月,采用CDNA2架构以及台积电 6nm 制程、2.5D EFB桥接技术。搭载厂商包括华硕、ATOS、Dell、技嘉、HPE、联想等。 表1:英伟达H100和A100参数 1.2、我国数据中心建设成本和高精度计算能力将受影响,自动驾驶云端训练短期受冲击较小 1)数据中心:美国对A100等高性能GPU的限制将影响国内阿里云、腾讯云、百度云等云厂商高端商用数据中心的建设。英伟达A100是全球领先的数据中心专用GPU,比如Facebook在2022年建成的AI研究超级集群至少采用了6080枚A100 GPU。美国禁令发布后,国内云厂商可以使用性能更低的替代产品,并靠堆数量的方法获得同等规模算力,但这将增加计算成本,同时一些高精度计算也会受限。英伟达创始人黄仁勋就表示将与中国客户合作寻找替代产品或申请许可证,对多数客户而言替代产品可以满足需求,但对需要A100全面性能的客户来说,替代产品性能会不足。 2)自动驾驶:对我国自动驾驶行业短期冲击较小,长期来看或可影响我国自动驾驶软件学习效率。此次受限芯片同样也应用于自动驾驶训练中,比如特斯拉最新的超级计算机使用超过7000枚A100 GPU进行自动驾驶训练;我国部分车企也基于英伟达A100打造了自动驾驶训练中心,比如2021年底蔚来宣布采用英伟达A100打造超级计算机,用于自动驾驶训练。 此次供应受限的A100和H100等芯片在自动驾驶中主要用于数据中心场景中的云端训练,而用于终端的英伟达Xavier、Orin等车载芯片则未受到限制。由于AI训练芯片不会随着终端销售规模的增加而快速消耗,因此短期来看存货足够则自动驾驶公司受到的冲击较小。比如小鹏汽车董事长认为公司目前存货可以满足未来几年的需求。但长期来看,若高端芯片持续升级,而我国高端芯片持续缺乏,则自动驾驶的云端训练将受到影响。 1.3、关注国产替代机会,但国产GPU产品性能与软件生态与英伟达仍有一定差距 我们认为美国对高端GPU芯片的禁令将推动GPU芯片的国产替代,国产AI芯片的自主可控提上日程。目前国内已上市的GPU公司包括航锦科技、海光信息、龙芯中科、景嘉微、寒武纪等;未上市的公司包括壁仞科技、摩尔线程等。 表2:国内GPU厂商梳理 从产品性能来看,目前国产高端AI芯片的通用性与英伟达相比仍有一定差距,但在某一些维度已经接近或者超过英伟达。比如寒武纪的思元290与英伟达A100均采用 7nm 先进制程工艺 ,而思元290的峰值计算能力为512TOPS@INT8,英伟达A100为624TOPS@INT8优于寒武纪;在未上市企业中,壁仞科技的壁砺100芯片采用 7nm 工艺,可提供2048TOPS@INT8,超过了A100略低于H100。 表3:国内外部分AI芯片性能对比 从软件生态来看,英伟达的CUDA生态具有较高的壁垒。2006年英伟达推出全球首款GPU的通用计算解决方案CUDA,CUDA工具包包括了GPU加速库、编译器、开发工具等。目前CUDA平台积累了大量软件库和开发者,形成了强大的生态效应。用户从CUDA平台迁移具有较高的成本。 2、风险分析 美方出口管制政策变化的不确定性 若美国进一步加强芯片的出口管制,比如扩大限售芯片范围,将影响我国进口相关芯片的公司的业务。 国产AI芯片研发进度不及预期 若国产AI芯片研发进度不及预期,则会拉开与英伟达、AMD等的差距。 高端GPU芯片代工环节受限制的风险 由于高端GPU芯片一般采用最先进制程,存在美国限制台积电代工相关产品的风险。