通信 AI算力下的液冷——从“可选”到“必选”之路 证券研究报告|行业深度 2024年03月25日 市场低估了液冷散热在AI算力中的重要性,在英伟达B100时代,风冷将逐步接近极限,液冷时代拉开序幕;而对国产算力来说,半导体制程上的短板更需要散热来补充,国内外对液冷的需求有望形成共振。我们认为,液冷从“可选”到“必选”的过程将大幅提升市场空间,成为算力重要细分赛道。 增持(维持) 行业走势 从技术路线看,冷板式间接液冷有望先于直接液冷获得推广。液冷系统可以根据液体与硬件之间的接触方式分为直接液冷和间接液冷,直接冷却包括浸没式和喷淋式,间接冷却主要是 冷板式。冷板式液冷技术工艺成熟,不需改变现有服务器的形态,加工难度低,成本较低,且冷却功耗可以满足AI服务器需求,有望率先获得推广。 冷板式液冷系统具备多链条复杂性特征,价值量主要集中在定制化核心部件。一套典型冷板式液冷系统的主要构成部分包含了冷板、热交换器、管路、泵、冷却液、控制系统等,越靠 近热源的组成部分,技术和工艺难度越高,从价值量来看,通常情况下具备定制化能力的零 32% 16% 0% -16% -32% 通信沪深300 部件价值量较高,如冷板和快接头,需要根据型号和芯片进行定制,且在数据中心中广泛使用,整体价值量较高;此外,CDU具备一次侧与二次侧的热交换能力,也是液冷系统中的关键器件之一,价值量较高。 两大边际变化推动液冷地位和空间双抬升。一方面,AIDC发展,大模型对高密度算力的需求不断提升,算力芯片、算力设备、数据中心机柜的热密度都将显著提高,传统风冷散热功耗上限无法满足AI服务器需求,液冷成为“刚需”;另一方面,产业自身对液冷的需求逐 渐成为主导因素,推动液冷技术发展不仅仅是出于政策和PUE考虑,更是源于数据中心自身对于高效散热方案的迫切需求,政策端与产业端的合力形成,液冷落地进展加速。 传统数据中心液冷渗透率稳步推进,AIGC增加新需求,市场空间有望超百亿元。液冷市场 空间构成可以按照增量和存量分为两大类别,增量空间是由AIGC大模型训练带来,存量空间是传统通用算力出于进一步降低PUE诉求,而逐步提高液冷渗透率带来的,液冷市场空间可以从两类大方向分别进行预测,加总统计后2025年市场空间超过205亿,其中AI服务器对应液冷的市场空间在2025年有望超160亿,通用服务器对应液冷的市场空间在2025 年有望超44亿。 纵观未来,解耦、成本性价比是推广关键,优选液冷公司可以从三大竞争力角度出发。液冷散热解决方案普及和推广在三个细分方向分别具有不同的核心选择,在技术路线上,解耦交 付是液冷得以脱离服务器强绑定关系的核心路径,成本性价比的反转是推动液冷普及的关键节点,在液冷行业优选优质企业侧重全链条能力、研发经验、研发资金三大竞争力。 投资建议:综上所述,优选液冷优质公司应该着眼于产业链布局完整性、研发投入强度和实际工艺技术等方面的经验积累,投资价值伴随格局分布形成“一强N多”的架构,英维克作 为传统散热白马龙头企业具备较强的比较优势,后起之秀也伴随各自优势领域有望在液冷行业整体发展的趋势下受益。 液冷系统解决方案厂商 核心推荐:英维克;建议关注:曙光数创、飞荣达、高澜股份、申菱环境、同飞股份等。风险提示:国产算力进展不及预期、AIDC发展不及预期、技术创新风险、市场规模测算风险。 2023-032023-072023-11 作者 分析师宋嘉吉 执业证书编号:S0680519010002邮箱:songjiaji@gszq.com 分析师黄瀚 执业证书编号:S0680519050002邮箱:huanghan@gszq.com 分析师石瑜捷 执业证书编号:S0680523070001邮箱:shiyujie@gszq.com 相关研究 1、《通信:光的盛宴——OFC热点前瞻》2024-03-242、《区块链:Restaking:推动DeFi进入“新次元”》2024-03-22 3、《通信:AI算力的ASIC之路——从以太坊矿机说起 2024-03-20 重点标的 股票代码 股票名称 投资评级 EPS(元) PE 2022A 2023E 2024E 2025E 2022A 2023E 2024E 2025E 002837.SZ 英维克 买入 0.49 0.68 0.92 1.23 63.88 46.03 34.02 25.45 资料来源:Wind,国盛证券研究所 请仔细阅读本报告末页声明 内容目录 投资要件4 1.液冷工艺多样,冷板式有望率先推广6 1.1液冷有直接和间接两大类技术路线6 1.1.1浸没式液冷6 1.1.2喷淋式液冷7 1.1.3冷板式液冷7 1.1.4混合液冷8 1.1.5液冷技术路线对比8 1.2冷板式液冷构件繁多9 1.2.1冷板:可定制化的核心组件9 1.2.2CDU:冷却液“调度官”11 1.2.3其他部件:部分可定制,匹配度是关键13 2.两大边际变化推动液冷地位和空间双抬升15 2.1变化一:AIDC驱动液冷从“可选”变为“必选”15 2.2变化二:政策端推动和产业端需求形成合力16 2.2.1政策驱动:PUE管控日趋严格16 2.2.2产业驱动:运营商、设备商、互联网共振17 2.3液冷空间破百亿20 2.3.1增量市场:AI大模型带来增量空间20 2.3.2存量市场:液冷渗透率持续提高21 3.液冷行业的当下与未来23 3.1液冷产业链参与者较多23 3.2行业格局:初步形成“一强N多”格局23 3.2.1海外:浸没式发展优于冷板,美国公司占主导24 3.2.2国内:冷板优先发展,参与者众多24 3.3未来:解耦、性价比与三大竞争力27 3.3.1技术:解耦交付是核心技术路径27 3.3.2成本:性价比反转是重要推广节点28 3.3.3三大竞争力优选液冷企业29 4.投资建议:32 5.风险提示33 图表目录 图表1:液冷技术路径分类6 图表2:单相浸没式液冷原理图7 图表3:两相浸没式液冷原理图7 图表4:喷淋式直接液冷系统工艺流程原理图7 图表5:冷板式液冷整体链路图8 图表6:英伟达COOLERCHIPS混合液冷方案8 图表7:液冷技术路线对比9 图表8:冷板内部拆分及散热板热量流动图10 图表9:冷板示意图(分体式)11 图表10:冷板设计考量参数11 图表11:液冷冷板剖面图11 图表12:冷却液分配单元内部结构12 图表13:机柜式CDU13 图表14:插框式CDU(平台式CDU)13 图表15:冷却液分配单元内部结构14 图表16:NVIDIADGXA100640GB最大功耗6.5千瓦15 图表17:NVIDIADGXH100640GB最大功耗10.2千瓦15 图表18:机柜尺寸对照表16 图表19:不同尺寸机柜示意图16 图表20:国内PUE相关宏观政策梳理17 图表21:国内三大运营商液冷三年蓝图设计18 图表22:中国移动汇聚机房单相浸没式液冷试点18 图表23:中国电信广州数据中心冷板式液冷微模块试点18 图表24:中国液冷服务器厂商市场份额(2023H1)19 图表25:宁畅液冷服务器市场份额(2023H1)19 图表26:百度“灵溪”液冷方案系统架构图20 图表27:液冷市场空间预测20 图表28:AI服务器对应的液冷市场空间增量预测21 图表29:通用服务器对应的液冷市场空间增量预测22 图表30:液冷行业产业链23 图表31:浸没式液冷海外公司情况24 图表32:冷板式液冷海外公司情况24 图表33:液冷投资标的(按照市值排名)25 图表34:解耦交付概览28 图表35:每瓦投资成本概览29 图表36:英维克Coolinside全链条液冷解决方案(冷板式液冷)30 图表37:各家液冷厂商研发费用(亿元)31 图表38:液冷核心投资标的32 图表39:液冷产业链公司32 投资要件 液冷技术发展已久,但实际应用中风冷依旧占据主导地位,究其根本在于风冷尚能满足大部分散热需求;算力时代来临,两大边际变化发生,一方面高密度算力基础设施推动液冷成为刚需,另一方面政策、产业形成需求共振,液冷落地和推广速度加快,市场空间进一步扩大: 边际变化一:AIDC发展下高密度算力需求提升,有限的风冷冷却功耗与显著提高的AI服务器功耗之间的矛盾成为制约智算中心发展的瓶颈之一,液冷方案重要性从“可选”上升至“必选”。 大模型兴起后的AI时代,并行计算网络下异构架构成为主流,AI服务器通常使用大量高功率的CPU、GPU芯片,整机功率随之大幅走高,如NVIDIAA100SXM芯片单卡功耗400W,8卡AI服务器单论GPU的热功耗就有3.2kW,H100PCIe5.0芯片单卡功耗更是高达700W,以H100为例,假设满配8卡,单台H100服务器仅内部GPU所需的功耗就达到5.6kW(且不论CPU、存储和额外的整机散热)。采用风冷技术通常可以解决15kW以内的机柜制冷,已经到了空气对流散热能力的天花板,而液冷数据中心单机柜可支持30kW以上的散热能力,刚需性显著体现。 边际变化二:液冷推动力从单一政策/PUE推动,变化为产业需求拉动为主、政策推动为辅,政策端推动和产业端需求形成合力,共振拉动需求增长。 液冷技术由来已久,前期主要受到政策推动和数据中心PUE值(能效指标)等因素的驱动,PUE值成为了评估数据中心能效的关键标准,液冷系统相对于传统的空气冷却系统在能效方面具有明显的优势,更加绿色节能。 但伴随AIGC的进一步发展,AI服务器和智算数据中心的热量功耗已经超过传统风冷散热的阙值,液冷成为实际应用中的最佳选项,产业自身的需求逐渐成为主导因素,新锐与传统服务器厂商纷纷布局液冷,互联网厂商也积极推进液冷,政策端与产业端共振加速液冷落地。根据英维克财报,主流的服务器制造商已在2022年开始陆续建设标准化规模生产冷板液冷服务器的产线,几乎所有的头部互联网公司都已对液冷技术密切跟踪,2022年内已开始出现冷板式液冷数据中心的规模部署,冷板式液冷技术在算力行业的产业链成熟度和生态匹配方面均已取得突破性进展。 优选液冷公司:全链条能力的“隐身”与“不可或缺”。液冷系统的多链条复杂性,吸引市场关注点分散至单个核心部件如冷板、CDU、快接头等,削弱了市场对全链条能力的 关注度,实际应用中全链条能力背后包含了液冷系统的高适配度、高稳定性和高可靠性,全链条能力在维护基础设施运行运维中不可或缺。优选液冷公司可以从三大竞争力出发,全链条能力优先性靠前,研发投入、经验累积也是关键因素,前者保障液冷方案的持续优化进步,具备跟芯片同步更新的能力,后者是液冷厂商打开更多渠道的敲门砖,也是实操中对产品力把握到位的重要前提。 投资建议: 优选液冷优质公司应该着眼于产业链布局完整性、研发投入强度和实际工艺技术等方面 的经验积累,投资价值伴随格局分布形成“一强N多”的架构,英维克作为传统散热白马龙头企业具备较强的比较优势。 核心推荐:英维克; 建议关注:曙光数创、飞荣达、申菱环境、高澜股份、同飞股份等。 风险提示:国产算力进展不及预期、AIDC发展不及预期、技术创新风险。 1.液冷工艺多样,冷板式有望率先推广 1.1液冷有直接和间接两大类技术路线 液冷系统可以根据液体与硬件之间的接触方式分为直接液冷和间接液冷。直接液冷系统中,液体与需要冷却的硬件组件进行接触,即冷却液体直接流经硬件表面,吸收并带走硬件产生的热量。直接液冷系统的液体与热源之间没有中介,散热效率更高,热量能够 更直接地传递到液体中,主要用于对散热效率要求较高的场景,直接冷却包括浸没式和喷淋式,其中浸没式根据冷却介质是否发生相变又可分为单相浸没式和相变浸没式。间接液冷系统中,液体不直接与硬件接触,而是通过一个中介组件(散热器或冷却块)与硬件接触,而冷却液体则与中介组件接触,通过其中介组件将热量带走,间接冷却一般为冷板式液冷,根据冷却介质是否发生相变又可分为单相冷板式和两相冷板式。此外,还存在混合液冷的散热方式,即核心