您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[-]:英伟达GB200、B210A时间线更新 - 发现报告
当前位置:首页/会议纪要/报告详情/

英伟达GB200、B210A时间线更新

2024-08-13--S***
英伟达GB200、B210A时间线更新

以下是专家观点: Patrick:GB200的时间线有更新吗? 专家:有消息称GB200将从2024年Q4推迟到2025年Q1。英伟达官方理由是由于GB200为客户提供了最佳的性能和价值,对GB200的需求持续超过预期。英伟达正努力让部分产品在4Q2024推出,但是大部分可能会在1Q2025开始出货。几乎所有的hyperscalers都将B100或B200切换成GB200,英伟达基本已经取消了B100和B200芯片的生产,GB200应该会在2025年1月份开始出货。 Patrick:DGX-B200的出货时间线是怎样的? 专家:DGX-B200跟GB200时间几乎一样,可能会略快一些。据了解,亚马逊和英伟达合作开发的ProjectCeiba是采用DGXCloud的AI超级计算机,搭载了20736颗GB200芯片,目前还不清楚是DGX还是仅仅是芯片,我们的猜测是它可能仅仅是芯片,但看起来英伟达就签了这份GB200的合同,他们可能会优先推出DGX,因为这涉及到了DGXCloud的发布,所以预计DGX-GB200可能会在相同的时间线出货,也有可能会稍早一些。 Patrick:HGX-B200大概什么时间可以拿到? 专家:Lambda几乎每周都在和英伟达进行沟通,但是他们并没有特别聚焦在具体的产品上,基本上只关注芯片本身,没有指定DGX或HGX。但是推测英伟达可能会优先快速推出DGX-GB200,因为距离上次更新DGX产品线已经有一段时间了。另外,大家担心的一个主要问题是关于液冷。Lambda内部有些人认为英伟达可能会优先将DGX出货给能够提供液冷解决方案的云厂商。然后英伟达目前面临的最大挑战可能是,美国和全球的数据中心空间还没有能力满足如此多的液冷芯片的需求。英伟达也有可能会优先推出HGX,这意味着英伟达会将其推向更有可能成功的云厂商,但是目前英伟达没有详细说明哪个会先出货。 Patrick:GB200除了液冷限制外,还有其他芯片级或封装级问题吗? 专家:听说可能存在rack方面的问题,不知道这是否与服务器机箱本身、电力还是液冷有关。不确定这是否仅仅是英伟达与单一供应商合作的问题。目前了解到最新的消息就英伟达在与GB200相关的机架问题上遇到了困难,但还没有听说芯片级别上的问题。 Patrick:您预计客户何时会开始在他们的数据中心部署GB200? 专家:一些hyperscalers计划在2025年Q1末也就是3月份部署。所以如果保守一点的话,预计会在Q2的4月份。 Patrick:考虑到GB200的延迟,如何预估2025年GB200的出货量? 专家:英伟达没有与我们分享具体的数字,但有听到一些传言说GB200在使用CoWoS工艺中芯片接合时遇到了一些良率上的问题,导致实际的产率可能只有计划的60%。至于B200,好像已经被取消掉,但也有可能会有一些非常有限的供应量,或许只有Meta或特斯拉这种战略性的非CSP的hyperscaler可能会得到少许B200的分配。另一个传言是所有的CSPs都决定从H100直接过渡到GB200,如果大家都在争夺同一款芯片的供应,就可能会导致一个缓慢的出货过程,考虑到一些出货的优先级等事情。但是目前还没有得到任何确认的消息,还没有听说芯片本身存在什么问题,只是听说量产爬坡速度的增长比预期的要慢。 Patrick:如何看待有传言说英伟达要求NCP合作伙伴大幅增加H100芯片的库存?这会 影响市场上的H100服务器价格吗? 专家:目前还没有见过英伟达降低其企业卡的价格,特别是在卡接近生命周期结束时,英伟达通常会提高价格,所以不认为这会影响定价。唯一可能会影响价格的原因是,如果OEM和ODM厂商继续受到挤压,他们在H100上的价格竞争变得更加激烈,那么利润率可能会略有下降。但是现在还没有听到很多关于有公司真正去买这些卡的传言或需求,唯一的例外是亚马逊可能会选择买更多的H100,但也并不完全确定他们的计划。因此,目前没有听说有公司下特别特别大的H100订单,但如果英伟达试图继续向市场推出更多Hopper卡也是合理的。 Patrick:所以您没有听说关于英伟达试图卖出更多Hopper卡的事情? 专家:没有。英伟达可能正在尝试,但不知道是否有人接受。第一梯队的CSP厂商有很大的可能会获得一些显著的折扣,而非Lambda这样的公司。 Patrick:有没有可能英伟达会强制要求超微电脑去购买更多Hopper芯片,以确保将来能 获得Blackwell芯片更好的分配比例? 专家:不排除这种可能性,但目前还没有听说这个消息,Lambda与超微电脑的关系非常密切。超微电脑投资了Lambda,但他们没有明确告诉我们这一点。虽然确实感觉到超微电脑的库存比计划得要多,但是不确定这是由于需求放缓,还是和戴尔及其他OEM厂商 的竞争加剧导致,超微电脑可能损失了一些在H100早期占领的市场份额。 Patrick:超微是否将其服务器价格从30000美元降至28000美元? 专家:超微在H100上的毛利率一直都很好,早期可能维持在15-20%左右,但随着戴尔等其他OEM的竞争,价格降低,利润率会有所下降,所以降价并不代表是英伟达给了H100芯片的折扣。 Patrick:预计超微电脑未来可以在其H100服务器上保持10%的毛利率吗? 专家:不认为他们的毛利率低于10%。现在确实看到了一些比较低的定价,但要将超微电脑的定价推到非常低的水平,订单规模需要至少4000颗,甚至8000颗芯片。所以也许在这种大规模的订单上,利润率会低于10%。但总体而言,整体的毛利率仍然会高于10%。 Patrick:如何看待H100服务器价格的趋势? 专家:可能会呈现略微下降的趋势。我们感觉超微的库存有可能会大于预期,或者下一季度可能会有很多GPU无法销售出去。在与超微沟通过程中了解到,他们可能需要降价来减少库存。 Patrick:戴尔呢? 专家:戴尔也是一样。戴尔进入H100服务器市场比较晚,但是看起来现在已经追赶上来。不过,最近的新闻表明,戴尔将砍掉15000或12500个工作岗位,主要是销售和市场部门。这表明也许戴尔的表现并不像大家想象的那么好,或者他们的利润率还不如超微健康只是在努力抢夺市场份额。在一些竞标中,有看到戴尔的报价比超微低很多。 Patrick:英伟达有没有向Lambda提供或者讨论过Rubin的时间线? 专家:简短地提到了一下。我们得到的时间线是生产样品的时间加上5个月的缓冲期。因此,GB200的时间大概是2025年1月,然后Lambda可能需要90天来部署。这就是为什么预估GB200的时间线在2025年4月。B200A是B100和B200的替代芯片,预计Lambda将在2025年10月左右使用,因此,英伟达可能会在2025年第二季度末或第三季度初开始为一些大客户提供。然后GB210、GB210A、B210A都预计在2026年第一季度开始出货,再是然后Rubin,所以大致估计2026年第三季度或第四季度出货,2026年下半年部署。 Patrick:对于B210A这一新产品有何看法?B210A的实际应用是什么? 专家:还没有太多信息,从英伟达给的性能规格来看基本上都一样,目前还无法从规格表上看出B200A和B210A之间的任何区别,可能英伟达只是将其命名为Blackwell与BlackwellUltra。可能的优势在于这是一个配备单个Blackwell芯片的风冷机架设计,所以晶体管数量减半。B210A将拥有与B200A相同的内存容量和带宽,在技术上会将NVLink域增加到64个,去除了FP64并增加了FP4TensorCore,可能会非常具体地针对某些使用场景,可能将在FP4TensorCore的工作负载上表现出色。但感觉B210A可能会与其他的芯片产品抢份额,英伟达目前在讨论三款芯片的推出时间,在2026年Q1同时推出三款产品似乎并不合理,所以我们猜测其中一款芯片可能会被取消。另外,推测英伟达命名为“A”系列可能是因为它是风冷的,从这一点来看,英伟达试图确保未来Blackwell有足够的风冷芯片。但除此之外,我们没有更多信息,预计这些新产品可能还会有很多变化,并且对所有这些新芯片的未来变化持保留态度,并不确定英伟达会做出什么改变。