您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [东兴证券]:超节点行业:从计算托盘角度拆解英伟达VR NVL72,通信速率三重升级,超级网卡价值显著提升 - 发现报告

超节点行业:从计算托盘角度拆解英伟达VR NVL72,通信速率三重升级,超级网卡价值显著提升

信息技术 2026-05-22 石伟晶 东兴证券 Man💗
报告封面

执业证书编号:S1480518080001 投资摘要: 2026年英伟达最新发布的超节点Vera-Rubin NVL72,是全球领先的Scale up网络算力平台。Rubin平台由六款全新芯片组成,包括VeraCPU、Rubin GPU、NVLink 6交换机、ConnectX-9 SuperNIC、BlueField-4DPU和Spectrum-6以太网络交换机。据英伟达公布的数据,Rubin平台的训练性能达到前代Blackwell的3.5倍,运行AI软件的性能提升5倍。此外,与前一代相比,英伟达Rubin平台在训练MoE模型时所需的GPU数量减少至原来的四分之一,进一步推动人工智能的普及应用。 在VR NVL72中,AI计算任务从外部网络进来,数据经过ConnectX-9、BlueField-4、Vera CPU,再分配到GPU和机架内其他71颗GPU协同完成计算,最后计算结果通过网络传送出去。在计算托盘中,数据传输路径可以分为三段:VeraCPU至RubinGPU之间通过NVLink C2C高速链路互联;VeraCPU至CX-9之间通过两条PCIeGen6链路分别连接到两个CX9的PCIe Switch模块;以及CX-9至OSFP之间通过800G以太网/ InfiniBand互联。 NVLink-C2C技术重构异构计算的互联范式,在裸片/芯片间互联领域建立巨大的领先优势。在VR200NVL72中,Rubin-Vera之间依托NVLink-C2C(Chip-to-Chip,芯片到芯片互联)实现双向带宽1.8TB/sCPU-GPU互联,延迟纳秒级,相比GB200 NVL72的NVLink-C2C的900GB/s,提升一倍。而主流PCleGen5架构双向带宽为128GB/s带宽,非一致性内存访问增加编程复杂性以及计算资源闲置等待。NVLink-C2C的核心技术原理在于:通过AMBACHI协议实现硬件级缓存一致性,CPU和GPU缓存自动同步;CPU内存与GPU显存在软件视角呈现为单一内存池;对系统范围跨处理器的原子读写无需额外同步原语。 采用PCIe Gen6协议实现VeraCPU与超级网卡CX-9互联。PCIe Gen6是第六代高速外设互联标准,CPU与网卡、存储等外设的通用接口。PCIe 6接口支持48条Lane,每条Lane单向速度64Gbps。因此,Vera与CX-9之间接口双向总带宽达到768GB/s。PCIe Gen6信号需要使用高端PCB与玻纤布传输。在VR200NVL72计算托盘中,PCIe Gen6信号从Strata模块传输到Orchid模块前端,PCB距离长达约500mm。为实现信号完整性,VR200 NVL72除了升级双向SerDes技术外,还需要升级PCB材料。在材料层面,CCL(覆铜板)从M7升级到M8/M9,主计算板和网络板的铜箔升级到HVLP4,材料价值显著上升;为了降低介质损耗,玻璃纤维布或价值更高的石英材料被用于Orchid板和中置板。 采用以太网/ InfiniBand协议实现超级网卡CX-9与OSFP光模块笼口互联。CX-9一项重要升级在于,其在以太网模式下通过单个端口即可提供1x800G的传输能力,无需依赖多链路聚合实现总吞吐量。相比之下,CX-8仅在InfiniBand架构下支持800G速率,但在以太网模式下通常以2x400G的配置呈现。在VRNVL72计算托盘中,8个800G的CX-9网卡对应OSFP笼位的数量有两种方案:一种是每颗GPU配1个1.6TOSFP笼口,则每个计算托盘共4个1.6TOSFP笼口;另一种则是每颗GPU配2个800G OSFP笼口,则每个计算托盘共8个800G OSFP笼口。 ConnectX‑8/9定位超级网卡(SuperNIC),性能远超传统网卡。2025年8月,英伟达正式发布专为Blackwell架构和加速超大规模AI工作负载而设计的ConnectX-8 SuperNIC。ConnectX-8 SuperNIC单端口800Gb/sInfiniBand(XDR)或双端口400Gb/s Ethernet(Spectrum-X),为上一代ConnectX-7(200Gb/s)的4倍,是当前业界最高带宽网卡。2026年1月,英伟达推出高性能智能网络接口卡ConnectX-9,核心变革在于实现单端口800Gb/s的以太网传输能力。 超级网卡内置PCIe Gen6交换模块,替代传统独立PCIe交换机。ConnectX-8内置48通道PCIe Gen6交换机,单芯片实现“网络接口+ GPU间交换”二合一,有助于消除IO瓶颈,并加快GPU、NIC和存储之间的数据移动速度。基于ConnectX-8的优化设计可为集群内的所有GPU间通信提供高达每个GPU50 GB/s的IO带宽,因为NCCL直接通过网络转发所有流量。 ConnectX集成Spectrum‑X交换逻辑,构成端到端800G AI网络。SuperNIC内部集成Spectrum‑X风格的交换与加速逻辑”并作为Spectrum‑X以太网平台的终端侧关键组件,与外部Spectrum‑X交换机(如SN5600列)端到端协同。交换机(Spectrum‑X Switch)与终端SuperNIC(ConnectX‑8)协同优化,为AI /超算以太网带来的五大关键性能提升。负载均衡方面,实现1.6X更高有效带宽;尾延迟优化方面,实现1.3X更高集合通信带宽;噪声隔离方面,实现2.2X更高All-reduce带宽;弹性性能方面,实现1.3X更高All-to-all带宽;高频遥测方面,实现1000X更快遥测采集。 投资策略: 自2025年开始,超节点成为AI算力网络重要的技术创新方向。本篇报告从计算托盘角度拆解英伟达VRNVL72,可以看到,英伟达VR NVL72以1.8TB/s NVLink-C2C+PCIe Gen6+800G SuperNIC构建三重高速通信壁垒,其核心竞争力源于芯片级互联、高速总线、超级网卡的全栈技术垄断。当前我国AI算力网络在超高速互联协议、800G SuperNIC、PCIe Gen6交换芯片等领域仍存代差,自主可控需求迫切。建议聚焦高速互联芯片、800G/400G SuperNIC、高端光模块、高速PCB /覆铜板、超节点整机方案五大国产替代主线。 相关公司: (1)高速网卡:裕太微(688515)、盛科通信(688702);(2)光模块:中际旭创(300308)、新易盛(300502)、天孚通信(300394)、东山精密(002384)、华工科技(000988)、光迅科技(002281);(3)高速交换芯片:盛科通信(688702)、紫光股份(000938)、锐捷网络(301165)、中兴通讯(000063);(4)高速互联芯片:海光信息(688041)、龙芯中科(688047)、长电科技(600584);(5)高速PCB /覆铜板:胜宏科技(300476)、生益科技(600183)、深南电路(002916)、东材科技(601208);(6)国产超节点:浪潮信息(000977)、中科曙光(603019)、工业富联(601138)、华勤技术(603296)。 风险提示:(1)技术代差;(2)国产超节点生态割裂;(3)地缘政治风险。 目录 1.超节点VR NVL72,全球领先的Scale up网络算力平台...................................................................................................42.拆解VR NVL72计算托盘,通信速率三重升级:1.8TB/s NVLink-C2C+ PCIe Gen6+800G以太网..................................93. ConnectX超级网卡价值显著提升:内置PCIe交换模块与以太网交换逻辑.....................................................................144.投资建议...........................................................................................................................................................................185.风险提示...........................................................................................................................................................................18 插图目录 图1:人工智能训练与推理对网络需求存在显著差异.............................................................................................................4图2:Scale up网络(左)与Scale out网络(右)特点对比.............................................................................................6图3:GTC2026大会上NVIDIA Vera Rubin NVL72机架.....................................................................................................7图4:VR NVL72机柜组织图.................................................................................................................................................8图5:VR NVL72机柜计算托盘顶视图..................................................................................................................................9图6:VR NVL72计算托盘拓扑结构...................................................................................................................................10图7:VR NVL72中Rubin-Vera芯片互联方式...................................................................................................................11图8:VR NVL72运算托盘信号路径图...............................................................................................................................12图9:VR NVL72计算托盘侧视图............................................................