摘要: 1,英伟达通过NVLink和NVSwitch实现多卡互联来规避监管。2022年6-8月美国商务部第一次明确限制AI芯片出口,英伟达通过降低20%带宽的方式特供中国 A800,实现大规模的小型显卡进行集成运算。美国出台第二次限制法案的可能性较大,冲击范围取决于打击力度。 摘要: 1,英伟达通过NVLink和NVSwitch实现多卡互联来规避监管。2022年6-8月美国商务部第一次明确限制AI芯片出口,英伟达通过降低20%带宽的方式特供中国 A800,实现大规模的小型显卡进行集成运算。美国出台第二次限制法案的可能性较大,冲击范围取决于打击力度。 2,国产算力厂商软件和硬件层面在2-3年内难以追赶英伟达。英伟达CUDA软件生态壁垒较高,NVLink、NVSwitch和定制化芯片能较好解决网络带宽、多卡协同等硬件问题。 3,国产算力厂商中比较看好摩尔线程、希姆计算、壁仞科技。摩尔线程通用计算场 景较多,翻译CUDA生态开发成本较低;希姆科技背靠字节,自身硬件支持比摩尔线程更好;壁仞科技产品亮眼。 4,国内大厂可通过多种方式规避监管。有全球业务的公司可以通过跨国代理公司绕过监管,或通过购买云服务获得算力。5,初创公司发展前景取决于现有客户、领投公司、创始团队。专家比较看好有通用应用场景的公司,有无大型科技公司提供生态(如大量短视频计算需求等)。创始团队是否有较强的技术背景也较为重要。 提问: Q:如何看待2022年美国出台芯片法案?对中美有哪些影响? A;美国政府打压由来已久,最开始对中兴通讯进行限制,2019年华为第一次被列入实体清单,导致海思受到极大限制。最近OPPO哲库直接解散,而手机芯片无法完全从高通体系中分离。 2022年6-8月美国商务部第一次明确限制AI芯片出口,通信带宽必须在600GB内,超范围的芯片禁止销售到大陆。当时腾讯、阿里等大厂已经有A100订单,英伟达通过降低20%带宽的方式特供中国 都受到影响,限制太死不利于市场竞争。 A800,避开监管。而美国打压中国AI发展决心较强,从2022年开始,美国政府聚焦在硬件方面(如超算芯片)进行限制。英伟达和AMD市场 Q:2023年7月可能出台第二次限制,怎么看待冲击范围和可能的应对策略? A:分3种情况。英伟达在上一次制裁中订单损失不大,因为可以通过NVlink自研的总线通讯协议,采用多卡互联的方式连接显卡,集成算力,即使阉割了性能,也可以通过大规模的小型显卡进行集成运算。1.性能限制程度较小。如果这次在A800的基础上进一步限制20%的带宽,仍能出口给国内字节、阿里、京东等科技大厂,符合出口管制,通过集成计算的方式提供算力。 2.性能限制程度较大。如果砍掉60%的性能,需要更多显卡,台积电订单堆积,产能可能跟不上。 3.最差的情况是美国商务部直接禁掉 NVLink和NVSwitch。无法在统一数据中心计算,英伟达在大陆的业务将受到极大影响,营收下降非常多。 Q:有没有可能只是传闻,不会落实?A:不排除这种可能性,利益相关的公司放出假消息,利好国产GPU公司。 Q:意味着国产算力厂商未来有更多机会,逐步实现英伟达的替换,那我们目前无法企及的技术有哪些? 但我认为这个消息是高概率事件,就算不是7月,也在不远的未来。因为美国政府限制中国AI发展决心强烈,让美国在AI发展中取得领先优势,扶持半导体,打压竞争对手。OpenAI在全球取得巨大成功,美国对于后来者的打击优先级很高。 A:软件层面壁垒较高。CUDA生态迭代了将近15年,英伟达在06-07年开始布局并行加速计算,主流深度学习框架 TensorFlow和Pytorch几乎只兼容 CUDA。谷歌OpenCL和AMDROM难以追赶,在2-3年内没法取得优势,需要大量科学家和工程师进行迭代。摩尔线程完全翻译CUDA硬件加速生态放到自己的产品上,遇到较多兼容性问题,会损失20%的算力。 硬件层面难点较多。网络带宽、多卡协同优化,是下一代数据中心最看重的点,如何将上万张显卡互联互通,NVLink、 NVSwitch和定制化芯片能很好的解决此类问题。其他公司哪怕投入很多资源,2-3年较难追上。 Q:如何理解中国算力芯片厂商? A: 景嘉微: 1.军工背景,没有加入AI计算软件库,通用计算场景落后,偏底层,没有创新性。2.42亿元的融资计划做通用GPU。 3.起步较晚,高管没有较好的技术出身,在硬件和软件方面和英伟达存在15-20年差距。 寒武纪: 1.团队不错,但思源370对主流算法加速能力较差,兼容性也较差。 2.营收依赖大客户,有江苏数据中心5亿元左右订单,在自由市场上竞争力较差。 3.脱离华为后,没有印象深刻的产品。 比较看好摩尔线程、希姆计算、壁仞科技。 摩尔线程: 1.办公类型显卡S50有电信、移动等订单,是比较稳定的营收。 2.应用场景较多,唯一一家普通人可能买到显卡尝试的公司。 3.买的Imagination的核心,比较有诚意。 4.最近融资15亿元,由腾讯领投,可以做轻量的边缘计算市场,如小模型推理、视频流加速等简单的算法。 5.转译CUDA可以快速兼容主流机器学习框架,开发成本较低,方案挺好的,损失20-30%的性能也没关系。希姆计算: 1.背靠字节,为字节提供视频流转译能力。 2.研发周期更长,自身硬件支持比摩尔线程更好。 壁仞科技: 产品亮眼,引起美国注意,降低了带宽。 Q:昇腾和海光了解吗? A:在云服务方面有较好的进展,如果国内确实有较大的缺口,腾讯推出的大模型超市、字节火山云,企业可以选择购买服务型定制化模型。 Q;会不会只限制A800,不限制H800,只有军工领域的芯片受影响,民用不受影响? A;不太相信。H800在算力上是A800的2-3倍,必然会受到影响。军工方面,超算中心有累积较多GPU库存。 Q:美国制裁以后还是得靠自主品牌,怎么看差距较大的情况下未来的机会窗口? A:即使在较差情况下,还是有办法规避。 1.跨国企业购买。比如字节、腾讯等全球都有业务的公司,可以通过跨国代理公司绕过监管。 2.转向购买云服务,提供算力。 Q:是否看好沐曦? 3.购买国内芯片。但目前存在较多问题,不会有任何一家公司占大头,美国有不断的限制政策,从通用计算来看,壁仞科技和摩尔线程相对有优势,生态兼容较好,迭代较快,且最近融资资金充足。 A:对最近成立的初创公司了解不多。认为初创公司取决于现有客户和领投公司,比较看好有通用应用场景的公司,有无大型科技公司提供生态 (如大量短视频计算需求等)。创始团队是否有较强的技术背景也较为重要。Q:无论军用民用都会限制吗?A:有威胁的都会限制。Q:美国有能力追踪GPU流向? A:美国强制要求台积电提供详细清单,对中国获得多少超算芯片非常关注,能掌握芯片流向。 Q:国内互联网大厂受限吗? A:取决于美国的打击力度和决心。字节10亿订单已经有库存了,之前商务部法令没那么严,可以通过跨国公司或跨国建立数据中心等方式规避,目前影响不大。 Q:目前对国内影响不大? A:1-2月内影响不大,如果禁令比较长期,影响还是有的,不利于国内AI市场发展。