英伟达以GB200为核心发布多款突破产品,显著提升计算性能:在GTC2024大会上,英伟达发布了划时代的Blackwell架构和基于此架构的GB200超级芯片,标志着GPU的全面升级。Blackwell是英伟达首个采用多芯片封装设计的GPU,在同一个芯片上集成了两个GPU,使得芯片算力得到跨越式提升,代表了生成式AI和加速运算领域的重大突破。采用Blackwell架构的GPU被划分为了B200和GB200两个产品系列。GB200不仅在算力上实现了质的飞跃,将AI性能提升至20 petaflops,在能耗成本上也实现了显著降低。其NVL72解决方案通过集成多个计算节点,为处理复杂计算任务和大规模AI模型提供了理想的平台,同时采用铜缆互联和冷板液冷系统设计降低了能耗和成本。随着AI技术的进步和应用领域的扩大,GB200及其供应链将对全球技术市场产生深远影响。 GB200供应链处于启动阶段,预计带动测试、封装增量市场:GB200超级芯片正处于设计调整和测试阶段,预计在未来几个月内确定订单和供应链配置。2024年下半年预计将有42万颗GB200超级芯片交付至下游市场。此外,GB200在研发过程中对测试和封装提出了新的要求,预计将催生相应增量市场:一是芯片尺寸的增大使得芯片的合格率下降,进而促进对半导体测试的需求增长;二是GB200预计将采用玻璃基板用于先进封装,以实现GB200的高性能和多功能集成。 芯片性能的提升使得玻璃基板封装成为芯片发展的关键方向之一:封装技术的迭代过程增加了引脚密度和带宽、缩小了传输距离和电阻,旨在实现连接效率的提升。当前传统有机材料基板在应对高性能芯片封装时显示出局限性,容量面临极限。相比之下,玻璃基板以其卓越的平整性、热稳定性和电气性能,提供了更高的互连密度和更低的功率损耗,成为提升封装性能的关键方向,为封装行业带来了新的增长机会。多家国外科技巨头如英特尔、三星、苹果都在积极布局玻璃基板产业,加速玻璃基板在封装行业的渗透率。国内众多企业如沃格光电、五方光电也已开启战略布局,在TGV技术方面取得了显著进展。 国内积极布局先进封装领域,继续看好国内逐步扩产的先进封装厂商。 长电科技聚焦XDFOI新技术、2.5D/3D技术的量产;通富微电聚焦消化高端CPU、GPU封装产能,现已涉及AMDMI300的封装;甬矽电子积极研发Fan-in/Fan-out、2.5/3D晶圆级封装相关技术,并大力建厂扩产,未来营收增长空间广阔。TGV当前仍在产业初期,我们看好TSV逐步放量的国内先进封装厂商,如长电科技、通富微电、甬矽电子、兴森科技等。 风险提示:技术落地不及预期;研发进度不及预期;业务拓展不及预期。 1.GB200深度创新,引领GPU全面升级 当地时间3月18日凌晨,英伟达创始人兼CEO黄仁勋在美国加州圣何塞召开了GTC2024大会,会上正式发布了面向人工智能模型的全新Blackwell架构,以及基于此架构的超级芯片——GB200。该项目正处于积极进行设计调整和测试阶段。 1.1.基于Blackwell全新架构,GB200不断扩展算力边界 Blackwell的全新架构使得芯片算力得到跨越式提升。Blackwell是英伟达首个采用多芯片封装设计的GPU,在同一个芯片上集成了两个GPU,代表了生成式AI和加速运算领域的重大突破。Blackwell架构的GPU,AI性能可以达到20 petaflops,而英伟达两年前发布的“H100”的算力为4 petaflops,使得在运行具有数万亿参数的实时生成式AI大型语言模型时,其成本和能耗实现了大幅降低。Blackwell并不是芯片的名称,而是作为整个平台的名字,采用Blackwell架构的GPU被划分为了B200和GB200两个产品系列。在Blackwell架构下,B200的晶体管数量是H100的两倍以上,达到2080亿个。基于台积电的N4P制程工艺,B200由两个Die(裸片)组合而成,通过Nvidia High Bandwidth Interface (NV-HBI)连接,带宽达到10TB/s。 GB200则是基于B200的进一步发展,提供了前所未有的推理性能与效率。GB200通过900GB/s超低功耗的片间互联,将两个B200 GPU与一个Grace Arm CPU相连,训练与推理LLM的性能比上代实现了大幅提升。英伟达首席执行官表示,基于Blackwell的架构,GB200在性能上具有巨大的升级。此前的H100的AI性能为每秒4千万亿次浮点运算,而GB200则为每秒20千万亿次浮点运算,是H100的五倍。在参数为1750亿的GPT-3 LLM基准测试中,英伟达称GB200的训练性能和训练速度均大幅领先H100。 此外,GB200在能耗成本上也带来显著降低。在1.8万亿参数的MoE架构GPT模型训练中,GB200实现相同目标所消耗的能源也远低于Hopper GPU。GB200的推出,标志着高性能计算领域的新时代正式开启,它不仅能够处理前所未有的复杂数据集,还能以更高的能效运行大型AI模型。 表1:英伟达产品性能对比 GB200 NVL72是一个机架级的解决方案,包含了多个GB200计算节点,使其成为处理复杂计算任务和大规模AI模型的理想选择。GB200 NVL72是基于GB200芯片的更大规模的集成系统,将多个GB200芯片通过高速互联技术组合在一起,形成了一个高性能的计算集群,在单个NVLink域中提供超过1PB/s的总带宽和240TB的快速内存,旨在满足未来计算需求的挑战。整个机柜配备了18个Compute Tray和9个Switch Tray,形成了一个单柜系统,其中72个Blackwell芯片实现了完全互联,这就是所谓的NVL72架构。此外,通过采用铜缆互联和冷板液冷系统设计,GB200 NVL72单机柜能耗在120KW左右,系统成本和能耗大幅降低。 图1:GB200产品效果图 图2:GB200 NVL72产品效果图 2.GB200供应链启动,带动增量市场旺盛需求 2.1.GB200供应链正式启动,催生封装、测试两大增量市场 GB200 DGX/MGX的供应链已经正式启动,预计2025年的订单和供应链配置将在未来几个月中得到最终确认。根据摩根士丹利预测,基于CoWoS的产能分配,2024年下半年预计将有42万颗GB200超级芯片交付至下游市场,2025年预计产量为150万~200万颗。如果今年的42万颗芯片一半被用于构建机架系统,一半被用于AI服务器,这将产生大约4000个NVL72机架系统和30000个HGX基板单元的需求。GB200 DGX NVL72机架系统则预计在今年第四季度开始出货400台机架,用于超大规模云计算服务商的运作。 GB200的研发过程对测试和封装环节提出了新的要求,预计将催生相应增量市场。 英伟达的目标是在当前光刻技术的芯片尺寸极限上来实现计算速度的极限,而不是通过减小芯片尺寸和使用芯片组来提高产量。GB200的高性能设计需要更先进的测试设备和技术来检测潜在的缺陷,确保每一个芯片的高可靠性。芯片尺寸的加大会导致芯片的合格率下降,进而促进对半导体测试的需求增长。随着HBM速度和容量的提升,内存测试器、探针卡和探测器的需求将会上升,将推动芯片级测试的更广泛应用。 GB200预计将采用玻璃基板用于先进封装,以实现GB200的高性能和多功能集成。 玻璃基板是一种表面平滑的薄型玻璃材料,是液晶显示器件的核心组成部分,同时也是电子信息显示行业的重要战略资源。这种基板以其高度精确、耐高温、抗腐蚀和无孔特性而闻名,对于半导体的生产至关重要。三星、AMD、苹果等企业此前表示将导入或探索玻璃基板芯片封装技术,将为玻璃基板行业注入新动能。为了在提升晶体管密度方面取得重大进展,从而实现更高的计算效能,英特尔已增加了对多个设备和材料供应商的订单量,规划在2026年到2030年间开始大规模生产用于下一代高级封装的玻璃基板。 3.玻璃基板:封装行业竞争的新节点 3.1.封装技术的迭代规律提升本质是提高连接效率 封装技术的迭代过程实际是连接效率不断提高的过程。传统封装时代,封装采用通孔插装、表面贴装方式,引脚密度小、传输距离长、带宽小、电阻大,传输效率低下。 20世纪90年代,焊球连接技术取代引线,增加了接触面积和引脚密度,减小了传输距离和电阻,芯片尺寸因此得到缩减。2000年以后,正式进入先进封装时代。晶圆级封装缩小了芯片尺寸,RDL、中介层、TSV等技术提升了芯片的堆栈密度和性能,Microbump和混合键合技术进一步缩小了触点间距和堆栈高度。封装技术的迭代增加了引脚密度和带宽、缩小了传输距离和电阻,实际上提高了连接效率。 图3:封装技术发展历程 先进封装技术的本质目的为进一步提高连接效率。为实现小制程芯片通过将小体积晶体管高密度排布获得的多功能、大算力,先进封装技术聚焦增加芯片间的连接效率(减小信号延迟、功耗,提升传输速率),提升连接的紧密度。增加连接效率,一般通过缩小触点距离以增加触点密度,以及缩小芯片与芯片、芯片与基板间的距离两方面实现。 3.2.玻璃基板性能出色,成为芯片封装的关键方向 随着高性能芯片的发展,传统有机材料基板在高性能芯片的封装应用中呈现出一定的局限性。芯片基板用于固定晶圆切好的晶片,是封装环节的关键部分。随着基板上固定的芯片数量增加,整个芯片集成的晶体管总数也相应增多。有机材料基板加工难度小,生产成本较低,在芯片封装领域已被应用多年。但随着对芯片计算需求的增加,信号传输速度、功率传输效率、以及封装基板的稳定性变得尤为关键,有机材料基板面临容量的极限。 玻璃材料独特的平整性质使得晶片间的互联密度大幅提升。相较于有机材料基板,玻璃材质的高度平整性有助于提升光刻过程中的聚焦精度,使得在相同面积内,玻璃基板上的开孔数量远超有机材料基板。开孔数量之间的间隔小于100微米,使得晶片间的互连密度大幅提升。 图4:玻璃基板结构图 图5:玻璃基板系统级封装原型 图6:玻璃基板可容纳多50%的小芯片 玻璃基板的热稳定性降低了芯片断裂的风险,提升了封装的稳定性。现代高性能芯片易产生大量热量,对散热管理具有更高的要求。有机材料基板与晶片的热膨胀系数差异过大,在高温环境下易出现变形或断裂等情况。玻璃基板的热膨胀系数与芯片相匹配,大大提升了散热性能,其高温下的稳定性能减少了变形及断裂风险。 玻璃基板电气性能优势显著,有效降低能耗与功率损失。玻璃基板具有低介电损耗特性,有助于实现更高效的信号和电力传输,能够显著降低信号传输过程中的功率损耗,从而提升芯片的整体运行效率。与有机基板相比,玻璃基板的厚度可减少约一半,用于大型耗电芯片将带来显著的速度提升和功耗降低。 图7:面板玻璃 图8:有机材料基板与玻璃基板性能对比 玻璃基板在封装领域的引入是一次重要的技术革新,不仅提升了芯片的算力和热稳定性,还降低了功耗损失和能源消耗,在多个层面实现了芯片性能的提升。半导体封装具备保持电气特性、保护芯片、缓和应力及调整尺寸配合四大功能。封装的核心作用是维持集成电路器件与系统之间的电学和物理连接。随着芯片速度的不断提升和功率的增加,芯片的散热问题变得更加突出。由于芯片钝化层质量的提高,封装用以保护电路功能的作用重要性正在下降,但玻璃基板的推出却打破了这一发展趋势。传统上,随着芯片性能的提升,其发热功率会大幅提升,使得发热问题越发严重。但玻璃基板不仅使得晶片间的互联密度得到了显著提升,从而增强了芯片的传输效率和计算能力,还极大地提升了散热性能,显著降低了由于发热带来的变形或断裂风险。此外,玻璃基板的低介电损耗特性有助于更高效的信号和电力传输,在提升芯片性能的同时,降低了信号传输过程中的功率损耗和能源消耗,提升了芯片的整体运行效率。这些优势共同作用,使得玻璃基板成为全面提升芯片性能的关键因素,不仅提升了芯片的功能性,还增强了其可靠性和环境适应性,预示着半导体封装技术的新时代的到来。 图9:玻璃基板性能优势