行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

超节点行业：从计算托盘角度拆解英伟达VR NVL72，通信速率三重升级，超级网卡价值显著提升

信息技术 2026-05-22 石伟晶东兴证券 Man💗

英伟达VR NVL72超节点分析

超节点VR NVL72概述

英伟达发布的超节点VR NVL72是全球领先的Scale up网络算力平台，由Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9 SuperNIC、BlueField-4 DPU和Spectrum-6以太网络交换机组成。Rubin平台训练性能是前代Blackwell的3.5倍，运行AI软件性能提升5倍，训练MoE模型所需GPU数量减少至四分之一。

计算托盘通信速率升级

VR NVL72计算托盘数据传输路径分为三段：

Vera CPU至Rubin GPU：通过NVLink C2C高速链路互联，双向带宽1.8TB/s，延迟纳秒级，相比GB200 NVL72提升一倍。
Vera CPU至CX-9：通过两条PCIe Gen6链路连接，双向总带宽768GB/s，需要升级PCB材料和SerDes技术实现信号完整性。
CX-9至OSFP：通过800G以太网/ InfiniBand互联，CX-9单端口即可提供1x800G传输能力，无需多链路聚合。

ConnectX超级网卡

ConnectX-8/9定位超级网卡，性能远超传统网卡，单端口支持800Gb/s InfiniBand或双端口400Gb/s Ethernet。

内置PCIe Gen6交换模块：替代传统独立PCIe交换机，消除IO瓶颈，提供高达每个GPU 50 GB/s的IO带宽。
集成Spectrum-X交换逻辑：与Spectrum-X交换机端到端协同，实现负载均衡、尾延迟优化、噪声隔离、弹性性能和高频遥测等五大关键性能提升。

投资建议

建议聚焦高速互联芯片、800G/400G SuperNIC、高端光模块、高速PCB/覆铜板、超节点整机方案五大国产替代主线。

风险提示

技术代差
国产超节点生态割裂
地缘政治风险

执业证书编号：S1480518080001 投资摘要： 2026年英伟达最新发布的超节点Vera-Rubin NVL72，是全球领先的Scale up网络算力平台。Rubin平台由六款全新芯片组成，包括VeraCPU、Rubin GPU、NVLink 6交换机、ConnectX-9 SuperNIC、BlueField-4DPU和Spectrum-6以太网络交换机。据英伟达公布的数据，Rubin平台的训练性能达到前代Blackwell的3.5倍，运行AI软件的性能提升5倍。此外，与前一代相比，英伟达Rubin平台在训练MoE模型时所需的GPU数量减少至原来的四分之一，进一步推动人工智能的普及应用。在VR NVL72中，AI计算任务从外部网络进来，数据经过ConnectX-9、BlueField-4、Vera CPU，再分配到GPU和机架内其他71颗GPU协同完成计算，最后计算结果通过网络传送出去。在计算托盘中，数据传输路径可以分为三段：VeraCPU至RubinGPU之间通过NVLink C2C高速链路互联；VeraCPU至CX-9之间通过两条PCIeGen6链路分别连接到两个CX9的PCIe Switch模块；以及CX-9至OSFP之间通过800G以太网/ InfiniBand互联。 NVLink-C2C技术重构异构计算的互联范式，在裸片/芯片间互联领域建立巨大的领先优势。在VR200NVL72中，Rubin-Vera之间依托NVLink-C2C（Chip-to-Chip，芯片到芯片互联）实现双向带宽1.8TB/sCPU-GPU互联，延迟纳秒级，相比GB200 NVL72的NVLink-C2C的900GB/s，提升一倍。而主流PCleGen5架构双向带宽为128GB/s带宽，非一致性内存访问增加编程复杂性以及计算资源闲置等待。NVLink-C2C的核心技术原理在于：通过AMBACHI协议实现硬件级缓存一致性，CPU和GPU缓存自动同步；CPU内存与GPU显存在软件视角呈现为单一内存池；对系统范围跨处理器的原子读写无需额外同步原语。采用PCIe Gen6协议实现VeraCPU与超级网卡CX-9互联。PCIe Gen6是第六代高速外设互联标准，CPU与网卡、存储等外设的通用接口。PCIe 6接口支持48条Lane，每条Lane单向速度64Gbps。因此，Vera与CX-9之间接口双向总带宽达到768GB/s。PCIe Gen6信号需要使用高端PCB与玻纤布传输。在VR200NVL72计算托盘中，PCIe Gen6信号从Strata模块传输到Orchid模块前端，PCB距离长达约500mm。为实现信号完整性，VR200 NVL72除了升级双向SerDes技术外，还需要升级PCB材料。在材料层面，CCL（覆铜板）从M7升级到M8/M9，主计算板和网络板的铜箔升级到HVLP4，材料价值显著上升；为了降低介质损耗，玻璃纤维布或价值更高的石英材料被用于Orchid板和中置板。采用以太网/ InfiniBand协议实现超级网卡CX-9与OSFP光模块笼口互联。CX-9一项重要升级在于，其在以太网模式下通过单个端口即可提供1x800G的传输能力，无需依赖多链路聚合实现总吞吐量。相比之下，CX-8仅在InfiniBand架构下支持800G速率，但在以太网模式下通常以2x400G的配置呈现。在VRNVL72计算托盘中，8个800G的CX-9网卡对应OSFP笼位的数量有两种方案：一种是每颗GPU配1个1.6TOSFP笼口，则每个计算托盘共4个1.6TOSFP笼口；另一种则是每颗GPU配2个800G OSFP笼口，则每个计算托盘共8个800G OSFP笼口。 ConnectX‑8/9定位超级网卡（SuperNIC），性能远超传统网卡。2025年8月，英伟达正式发布专为Blackwell架构和加速超大规模AI工作负载而设计的ConnectX-8 SuperNIC。ConnectX-8 SuperNIC单端口800Gb/sInfiniBand（XDR）或双端口400Gb/s Ethernet（Spectrum-X），为上一代ConnectX-7（200Gb/s）的4倍，是当前业界最高带宽网卡。2026年1月，英伟达推出高性能智能网络接口卡ConnectX-9，核心变革在于实现单端口800Gb/s的以太网传输能力。超级网卡内置PCIe Gen6交换模块，替代传统独立PCIe交换机。ConnectX-8内置48通道PCIe Gen6交换机，单芯片实现“网络接口+ GPU间交换”二合一，有助于消除IO瓶颈，并加快GPU、NIC和存储之间的数据移动速度。基于ConnectX-8的优化设计可为集群内的所有GPU间通信提供高达每个GPU50 GB/s的IO带宽，因为NCCL直接通过网络转发所有流量。 ConnectX集成Spectrum‑X交换逻辑，构成端到端800G AI网络。SuperNIC内部集成Spectrum‑X风格的交换与加速逻辑”并作为Spectrum‑X以太网平台的终端侧关键组件，与外部Spectrum‑X交换机（如SN5600列）端到端协同。交换机（Spectrum‑X Switch）与终端SuperNIC（ConnectX‑8）协同优化，为AI /超算以太网带来的五大关键性能提升。负载均衡方面，实现1.6X更高有效带宽；尾延迟优化方面，实现1.3X更高集合通信带宽；噪声隔离方面，实现2.2X更高All-reduce带宽；弹性性能方面，实现1.3X更高All-to-all带宽；高频遥测方面，实现1000X更快遥测采集。投资策略：自2025年开始，超节点成为AI算力网络重要的技术创新方向。本篇报告从计算托盘角度拆解英伟达VRNVL72，可以看到，英伟达VR NVL72以1.8TB/s NVLink-C2C+PCIe Gen6+800G SuperNIC构建三重高速通信壁垒，其核心竞争力源于芯片级互联、高速总线、超级网卡的全栈技术垄断。当前我国AI算力网络在超高速互联协议、800G SuperNIC、PCIe Gen6交换芯片等领域仍存代差，自主可控需求迫切。建议聚焦高速互联芯片、800G/400G SuperNIC、高端光模块、高速PCB /覆铜板、超节点整机方案五大国产替代主线。相关公司：（1）高速网卡：裕太微（688515）、盛科通信（688702）；（2）光模块：中际旭创（300308）、新易盛（300502）、天孚通信（300394）、东山精密（002384）、华工科技（000988）、光迅科技（002281）；（3）高速交换芯片：盛科通信（688702）、紫光股份（000938）、锐捷网络（301165）、中兴通讯（000063）；（4）高速互联芯片：海光信息（688041）、龙芯中科（688047）、长电科技（600584）；（5）高速PCB /覆铜板：胜宏科技（300476）、生益科技（600183）、深南电路（002916）、东材科技（601208）；（6）国产超节点：浪潮信息（000977）、中科曙光（603019）、工业富联（601138）、华勤技术（603296）。风险提示：（1）技术代差；（2）国产超节点生态割裂；（3）地缘政治风险。目录 1.超节点VR NVL72，全球领先的Scale up网络算力平台...................................................................................................42.拆解VR NVL72计算托盘，通信速率三重升级：1.8TB/s NVLink-C2C+ PCIe Gen6+800G以太网..................................93. ConnectX超级网卡价值显著提升：内置PCIe交换模块与以太网交换逻辑.....................................................................144.投资建议...........................................................................................................................................................................185.风险提示...........................................................................................................................................................................18 插图目录图1：人工智能训练与推理对网络需求存在显著差异.............................................................................................................4图2：Scale up网络（左）与Scale out网络（右）特点对比.............................................................................................6图3：GTC2026大会上NVIDIA Vera Rubin NVL72机架.....................................................................................................7图4：VR NVL72机柜组织图.................................................................................................................................................8图5：VR NVL72机柜计算托盘顶视图..................................................................................................................................9图6：VR NVL72计算托盘拓扑结构...................................................................................................................................10图7：VR NVL72中Rubin-Vera芯片互联方式...................................................................................................................11图8：VR NVL72运算托盘信号路径图...............................................................................................................................12图9：VR NVL72计算托盘侧视图............................................................

点击免费查看完整报告

超节点行业：从计算托盘角度拆解英伟达VR NVL72，通信速率三重升级，超级网卡价值显著提升

你可能感兴趣