26年国内超节点进展加速,华为在25上半年用384超节点打响第一枪后,陆续已有十余家厂商公布超节点方案,包括阿里的磐久128、中科曙光ScaleX640、新华三UniPOD 64,昆仑芯64超节点、沐曦16~128超节点等,昇腾下一代Atlas 950 SuperPoD 8192卡超节点、Atlas 960 SuperPoD 15488卡超节点、曙光ScaleX640的总算 国产算力预期差:超节点不是贵在芯片,而是通讯! 26年国内超节点进展加速,华为在25上半年用384超节点打响第一枪后,陆续已有十余家厂商公布超节点方案,包括阿里的磐久128、中科曙光ScaleX640、新华三UniPOD 64,昆仑芯64超节点、沐曦16~128超节点等,昇腾下一代Atlas 950 SuperPoD 8192卡超节点、Atlas 960 SuperPoD 15488卡超节点、曙光ScaleX640的总算力规模可与NV下一代超节点比肩。 昇腾950的系统级战力核心在互联+内存,而非单卡高精度算力极限。 单芯片支持低精度达到1 PFLOPS(FP8)/2 PFLOPS(FP4),卡间互联带宽提升至2 TB/s,自研低成本HBM方案使内存容量与带宽显著抬升,为大规模集群效率提供关键支撑;但在高精度(FP16)单卡指标上,存在910C强于950的差异点,950系列转向以系统级效能对标海外。 可以把AI超节点的优势类比成“把一辆普通公交车换成一趟高铁编组”:当你要训练/推理的AI模型特别大,像带一大群人和大量行李远距离旅行时,“高铁超节点”这种全局优化的高速交通与资源池极大提升了效率和可靠性。 即使单节车厢(单张卡)动力略逊,整体运输能力远胜“无协同公交车队”。 普通公交车(非超节点):每辆车(每张加速卡/服务器)各自跑在自家线路上,只能装有限的人和行李,路也不宽,车之间交流困难。 如果一大批乘客要从A地赶到B地,大家可能要不断换车,路上排队、堵车、行李传来传去,很浪费时间,整体效 高铁编组(超节点):把一整列车厢(数百、上千张加速卡)连在一起,用高速轨道(高速互联网络)打通,每节车厢之间装了多条超宽通道(高带宽、低时延互联),行李舱超大(内存容量和带宽提升),乘客可以在整个编组内自由快速流动,共享车载资源。 单节车厢如果人满了,其他车厢能够立即支援,信息(数据)传递很快,全体同步完成目标,整体运行效率远超普通公交车队。 今年起往后,超节点将成为国产算力主战场,直接拉动“背板/IO连接器+交换芯片”价值量。 基于昇腾950DT的Atlas 950超节点,单柜间全光互联带宽达16.3 PB/s、单超节点FP8算力8 EFLOPS,最大支持8,192张卡,进一步组合成SuperCluster达到50万+卡量级,行业将从“单卡比拼”迁移到“系统互联能力+规模化部署”的竞争范式。 国产超节点部署的底层逻辑,是“用规模提性能,以网络补算力”,在单卡性能不足的天然弱势下,凭借在网络侧(高速线模组+光模块+交换芯片)的额外投入,缩小与海外的差距。 26年国产算力投资机遇,可重点关注网络互联侧的爆发,出于集群弥补单卡算力不足的逻辑,国产超节点中的网络侧价值量占比有望显著高于海外AI集群。 对连接器/交换芯片的产业带动具备“数量×速率×架构升级”的三重放大:①机柜内正向“正交背板”技术迭代,叠加800G/1.6T接口速率跃升,背板连接器密度与价值量显著提升;②跨柜“全光互联”普及,高速IO连接器(如800G)与光模块配套需求扩容,同样量价齐升;③UB统一互联协议+自研交换芯片(LSE/HSE)构筑超节点“Scale-up”主网,交换芯片用量相较传统多数十倍,交换芯片与GPU配比≈1:1甚至更高,国产替代弹性显现。 继续看好国产算力超节点网络互联侧各环节龙头:背板高速连接器(华丰科技)、IO高速连接器(意华股份)、交换芯片(盛科通信)、光模块(华工科技)。