今天晚上的会议主要是为了澄清一些之前存在的分歧和误解,特别是关于“铜进光退”现象和交换机光模块配比下降的问题,这些因素曾导致光模块市场的回调。我们已经对这些担忧进行了详细的测算和评估。事实上,无论是从铜缆的使用还是光模块的配比来看,自GB200发布以来,市场都出现了一些变化。今晚我们会讨论如何看待这些变化,并预测它们最终的影响。 首先,我要分享的结论是,我们认为既没有铜缆使用量的大幅提升,也没有光模块配比的下降;实际上,配比应该是在上升。从hpop系列到black2系列,从GH200到GB200,光模块的边际增量非常明显,排放最多。以前大家可能认为潼南或其他领域的增量更大,但现在看来,它们都不及光模块的增量。这就是我们得出的最终结论。 由于今晚不能使用PPT,我们将在面对面的会议中提供更为详细的数据和结果 。那时,我们还可以就这些结构和推导的结果与大家进行深入的交流。 现在让我们更新几个要点。首先是GB200的更新,因为目前的核心关注点就是这个支持NVLink72链路的机柜。大家可以在英伟达的官网上找到一些这个机柜的文档和白皮书。在这个文档中,所有的配置都是针对单个机柜的。这个机柜内有9台交换机,每台交换机有18个NVswitch芯片,每个交换机内有两个。而上面没有第二层交换机了,所以柜内全部使用铜缆连接IB。之前的理解是因为看到全铜的柜子,而光模块只占很小一部分,导致大家认为配比可能只有1比2,甚至不到1比2,这就是以前的分析逻辑。但是,如果基于GB200的销量 ,真如大家预期的那么乐观,那么光模块的需求一定会强于以前的产品。所以 ,这其中的误解可能是因为大家没有用正确的方式做比较。 实际上,大家在比较GB200和GH200时,没有使用相同的维度。GB200的配置参数是针对单个机柜的,而GH200的对比是基于一个集群的配置。虽然单个柜子拥有1.44亿个flops,原有集群大约有256个GPU,算力大约在一个亿以上,看上去算力相仿,但是节点数量有很大差异。这样的比较就像是对比一个精装修的窗台上墙砖的数量,与一个整套房子的墙砖数量,显然是不合理的。如果节点数减少,那么交换机和光模块的使用量自然会减少。因此,如果要合理比较,应该是拿一个新房子的使用材料,与一个老房子的使用材料进行对比。 首先,我们应该如何比较GB200和GH200?我们应该将所有机柜配置的集群相互比较,这是考虑光模块使用情况的合理方式。原因在于光模块与GPU的数量并不是线性关系。人们常常误以为这种比例是1比3,但却忽略了它可能高达1比9。这种关系实际上是累加的:GPU或交换节点越多,对非阻塞全互联网络的要求就越高,光模块的增长呈指数性,但节点很少时,光模块的需求甚至为零。因此,我们应该比较相同的集群,而不是将单一机柜与GH200的整个集群对比。这是关于误解的一个核心因素。 接下来,我们来探讨为什么英伟达要推出GB200和GH200。他们实际上是将GPU从机柜中剥离出来,构建了一种无阻塞全互联的集群。这使得所有GPU仿佛合并成了一个庞大的GPU,无论是之前的256个GPU大集群,还是现在整个机柜的576个B200大集群。这就好比一张巨大的DPU,这样的计算性能表现非常高。所谓的无阻塞全互联,定义上是指集群中每个GPU都能达到每个链接的理论最高带宽和传输速度,即每个GPU的传输速度都不受限。 那么,单个机柜上是如何实现无阻塞全互联的呢?GB200包含2个B200,每个B200带有18个第五代NVLink的链接。这些链接的双向带宽从每秒50GB升级到了100GB。72个B200,总共1296个链接。机柜内包含9台NVLink第四代的交换机,每个交换机有72个NVLink端口。集群中的交换机与GPU的链接可以完全匹配,因此在单机柜内,这种无阻塞全互联的效果可以实现,就好像72个GPU是一个整体。 然而,如果除了单柜外还要购入更多机柜来构建集群,问题就出现了。例如,老黄在他的演示中使用的是576个GPU,即8个机柜的配置。在这种情况下,需要高性能光模块来实现八个机柜的无阻塞全互联。因此,我们应该对比GB200的576个GPU集群与GH200的256个GPU集群,而不是单独的机柜与GH200的16个机柜。前者节点少,光模块需求自然少,这样比较不公平,也没有意义。 问题在于如何实现GB200的机柜互联。有人提出使用InfiniBand(IB)或以太网交换机。但为什么之前GH200的机柜互联不采用IB而是使用A-Link?举个例子,我们可以将数据包比作汽车,网络比作马路。如果只有少数通道连接机柜 ,即使内部流量顺畅,互联之间的狭窄点也会成为集群通信的瓶颈。因此,为了提高效率,需要拓宽连接到浙江、江苏等地的通道,这也是GH200机柜之间为何采用NVLink交换互联的原因。只有这样,256个GPU或者16个机柜才能像一个整体运作。 好的,现在我们关注GB200。如果采用8个机架配置,即576个GPU的情况,必定会有第二层的光互连。这一点可以在宣传视频中看出,视频里展示了柜子的图,除了放置服务器的8个机架之外,旁边还有许多柜子,里面应该就是第二层的交换机。网络上目前还没有这种网络拓扑图的公开资料,只有GB200单机柜的资料,因此容易造成误解。 那么,我们来估算一下,GB200究竟需要多少个第二层的交换机,以及光模块的配置应该是怎样的。我们可以参考GAH200的情况。GAH200的第二层使⽤36台交换机,因为它的集群由256个GPU组成,每个GPU连接18个NVLink,单个NVLink的双向带宽为50GB/s。256个GPU就会有4608个NVLink。为了保证这些链接都能得到有效的配对,在第二层交换机上,每台交换机需要有128个链接。这样,4608个链接除以每台交换机的128个端口,正好是36台。而每个交换机端口的带宽是800G,也就是4个NVLink的总带宽,所以交换机需要配置32个800G的光模块。 将情况转移到GB200,576个GPU,每个GPU依然是18个NVLink,但单个NVLink的双向带宽翻倍。所以576个GPU构成的大型集群会有10368个NVLink。第二层的交换机每台可容纳144个端口,所以需要72台交换机才能做到全互联 。现在每个端口对应的是四个NVLink,而NVLink的带宽已经提升到1.6T。因此,整个系统中每台交换机必须配备36个1.6T的光模块,最终得出的光模块与GPU的配比是1比9,与GH200相同。 所以,如果说GH200的市场表现不佳,现在GB200的市场表现出色,光模块的销售增长在哪里呢?首先,1比9的配比方案在GH200时代并未广泛采用,但现在随着GB200的出售,这种配比的需求将明显提升。其次,光模块的速率也提高到了1.6T,不仅数量增加,而且单价也提高,这可能还会带来利润率的提升 。因此,目前来看,GB200之后的弹性可能是最大的方向。但是由于网上的一 些误解,许多人低估了这一部分的预期,认为可能会受损,这是一个重大的误解。 至于具体的测算,我目前只是手工计算,我们会将它整理成PPT和文稿,以便与各位领导进一步沟通。到目前为止,根据不同渠道反馈的情况,GB200的预售情况实际上是不错的。而且,大多数购买者不只是购买一个机柜,很少会有只买单柜的客户。即使算力需求不大,购买单柜也需要配套的数据中心和网络环境,这种客户实际上是很少的。通常,需要大量计算力的大型工厂会购买带有互联功能的版本,这就意味着光模块的需求会大幅增加。每增加一个节点,光模块的需求就会相应提高,前提是网络接近无损全互联的配置。因此,光模块的使用比会有显著不同。与GH200相比,GB200的销售提升将更为明显,光模块的边际增长将会显著。 目前来看,在GB200光模块畅销的背景下,我们认为相对于铜缆,光模块的增长潜力可能会更大。这部分归功于光模块本身所具备的更高带宽,例如从800G提升到了1.6T。由于带宽提高后,对信号传输的衰减和对电磁干扰的要求随之增加。在GB200中,第二层交换机附近的距离可能超过1米甚至2.3米,这使得从铜缆切换到光缆成为一种必要。在GB200第二层交换机中,提供了三种可选方案,包括passivecopper(无源铜缆)、activecopper(主动铜缆),以及光缆。随着带宽的不断提高,既然目标是构建无损光网络并提升性能,因此光模块的比重必然会不断增加。所以,光模块目前来看是弹性最大的方向。然而 ,这一切讨论的基础,在于整体算力和数据量仍将显著增长。 显然,我们的选择毫无疑问会倾向于标的“易中天”,作为光模块领域的龙头公司。去年专家们指出光模块在数据中心资本支出中只占少数份额,但考虑到AI领域的投资增加,我们认为光模块在数据中心的价值份额应该得到提升。如果光模块的价值份额没有提升,那么去年北美资本开支的显著变化和光模块公司的单季度大变化就无从解释。光模块的价值份额提升了,以及在网络上的占比提升,从而带来了超越行业增速的超额收益。 以往在通用数据中心,光模块份额可能仅占一两个百分点。而现在,我们认为超过十个百分点的占比也是可能的。即使在整个集群中占比超过十个百分点,这仍属于成本较低的项。然而,它能显著提升GPU集群的性能。因此,在节省成本时,应该先考虑CPU和服务器的开支,而非省那些关键性和成本占比不高的光模块。 由于之前的一些误解导致市场出现回撤,但我们认为某些股票目前是有价值的 。结合上周北美光通信展(VIC),我们预计二代交换机所用的光互联可能将开始适配新型光模块,例如LPO、LRO或硅光方案。公司如新兴、旭创等已有相应准备。同时,考虑到功耗问题,如果机柜内部采用光模块,必须重视功耗管理。 我们终究还是建议关注三家核心光模块公司。“去创新”、"盛天福"在这方面的发展速度最快。LPO出货量在新型需求下增长,CPU领域也在进行B类测试 。因此,从研发、产能、成本各方面考虑,头部公司的优势非常明显。我们建议密切关注这三家核心公司,同时也需注意LPO、LRO和硅光等新光模块方面的发展。 总结今天的讨论,第一点,之前大家关于铜缆替代光缆或者光模块配比下降的疑虑全是误解。在GB200升级过程中,光模块恰恰是最大的增量所在,并且配比没有下降,反而会进一步提升。这一切建立在算力需求持续大幅增长、模型规模持续大幅提升的基础上,而且GB200的销量可能超出预期。第二点是关于新技术的落地速度快速提升。随着技术的发布和落地,功耗和成本的优化变得极为关键。第三点是网络协议层面的变化也值得关注,这可能会导致整体生态结构的变化。供应链管理的安全性和可靠性的重视也是一个不容忽视的趋势。 首先,在收回采购权之后,大部分传统网络解决方案基本上都是基于以太网架构构建的。针对AI无线网络就需要进行以太网的IDMA升级或超以太网升级。这种变化对光模块、交换机和网络侧会产生什么影响呢?下游客户可能会变得更为分散。如果市场上大部分人都购买NVIDIA的Superpod解决方案,那么光模块的下游客户理论上只有NVIDIA。这种供应过于集中的情形可能会减弱光模块的议价能力,包括盈利状况,实际可能更加紧张。而分散之后,由于AI应用场景繁多,新兴的AI公司和集群公司也在增加,整个中游行业在利益和定价权上很可能会有提升。 其次,采购权回归制造商之后,很多厂商在光模块的市场份额可能会有所不同 。例如,亚马逊的份额在Inphi和Luxtera是较高的;而Meta之前则偏向于Intel等。现在可能中国厂商如Lumentum、新英讯等的比重会上升。因此,采购的回归对于各自光模块或交换机供应商的市场份额有潜在提升的预期。这也是一个从光模块头部集中角度可能出现的变化。 综合来看,结合到四月份的生产制造,以及之前的一波市场回调,当前的估值仍非常具有性价比。展望未来,如果GB200的表现大幅超出预期,光模块的业务弹性有可能超过服务器、交换机、PCB等多个方向,这是由于集群需求的不断增长,需要升级和扩容。这是