AI服务器加速渗透,多相电源量价齐升 2023年6月29日 证券研究报告行业研究 行业专题研究(普通)半导体投资评级上次评级 看好看好 莫文宇电子行业首席分析师执业编号:S1500522090001联系电话:13437172818邮箱:mowenyu@cindasc.com 韩字杰联系人邮箱:hanzijie@cindasc.com 信达证券股份有限公司CINDASECURITIESCO.,LTD北京市西城区闹市口大街9号院1号楼邮编:100031 AI服务器加速渗透,多相电源量价齐升 2023年06月29日 本期内容提要: 多相电源是CPU/GPU供电的主流方案。数据中心需求快速增长,服务器功耗日益提升。与此同时,GPU、CPU等算力芯片朝着更高性能升级也对供电系统提出更高要求。多相控制器+DrMOS的多相电源方案目前被公认为是CPU/GPU供电的最佳解决方案。多相Buck电源包含控制器和DrMOS,是一种多路交错并联的同步Buck拓扑,每相Buck对应的半桥MOSFET可由包含驱动和温度/电流检测的DrMOS代替,由一个控制器采集反馈的电压、电流、温度/错误等信号,并发出各PWM波实现功率的闭环控制。控制器可通过特定协议的通信接口和信号指示I/O口,与系统上位机或负载处理器进行信号交互。 AI服务器有望带动多相电源量价齐升。根据MPS的测算,一台普通服务器中CPU及内存电源、POL和EFuse等产品的价值量总计约80美金。AI服务器在普通服务器的基础上,通常会增加4~8颗GPU,以多相控制器和DrMOS组成的多相电源同样是GPU的供电解决方案,且GPU相较于CPU功耗更高,对多相电源的需求进一步提升。以英伟达H100为例,一颗GPU需要40~50颗DrMOS,而服务器多相控制器通常采用12相方案(1颗多相控制器对应12颗DrMOS),因此多相控制器数量约为4~5颗。考虑一颗DrMOS或多相控制器的价格均为1~2美金(以1美金/颗进行测算),则一颗H100需要多相电源的价值量约为40~50美金。若一台AI服务器搭载8颗H100,则单台AI服务器中多相电源的价值量约320~400美金,相较于传统服务器而言有4~5倍增量,价值提升显著。 国内多相电源厂商加速替代。多相电源市场仍由海外龙头厂商主导,国内厂商积极突破壁垒。当前多相电源市场的主要供应商包括MPS、TI、英飞凌、安森美、瑞萨等,国内厂商主要包括杰华特、晶丰明源、矽力杰、圣邦股份、长工微、奥拉等。杰华特在2020年成功研发出用于CPU供电的智能功率级模块(DrMOS),2022年,公司DrMOS系列继续推出了多个料号,在计算和服务器领域获得客户的认可,开始大批量供应。晶丰明源目前已有从4相到16相一系列数字多相控制技术,在大电流DrMOS领域,目前公司50A、70A、90ADrMOS处于产品研发阶段。 投资建议:AI技术阶跃式发展带动AI服务器出货量快速提升,多相电源作为服务器CPU/GPU主流供电方案或将持续受益于AI浪潮趋势,我们测算AI服务器多相电源相较于传统服务器有4~5倍增量,而国内厂商正处于积极突破壁垒、加速导入阶段,未来发展空间较大。建议关注国内多相电源厂商:杰华特、晶丰明源等;服务器厂商:工业富联、 沪电股份等;算力芯片厂商:寒武纪、海光信息、兴森科技、芯原股份、深南电路等。 风险因素:AIGC技术发展不及预期;AI服务器渗透率不及预期;国内产品技术突破不及预期。 目录 多相电源是CPU/GPU供电的主流方案4 AI服务器有望带动多相电源量价齐升7 国内多相电源厂商加速替代10 风险因素12 表目录 表1:NVIDIA、AMD主要GPU产品算力和功耗7 表2:杰华特DC-DC类芯片,智能功率级模块(DrMOS)与国际竞品比较11 表3:晶丰明源多相数字控制器产品11 图目录 图1:数据中心电源架构(a:传统12V总线电源架构;b:新兴48V总线电源架构)4 图2:CPU/GPU对功耗要求逐渐提升4 图3:基于多相Buck的小占空比供电架构方案5 图4:DrMOS采取合封方式有效降低面积、提升效率5 图5:与传统分立设计相比,DrMOS效率高达95%,且能减少功耗、降低温度6 图6:MPS测算普通CPU服务器中电源价值量约为80美金8 图7:H100中DrMOS的分布8 图8:GH200超级芯片中DrMOS和电感的分布9 图9:2020-2023年全球服务器整机出货量9 图10:2022-2026年全球AI服务器出货量及预估9 图11:多相电源解决方案供应商10 图12:MPS数据中心解决方案10 图13:MPS在计算领域的布局10 多相电源是CPU/GPU供电的主流方案 数据中心需求快速增长,服务器功耗日益提升。近年来,随着人工智能、大数据、云计算、5G通信等新兴技术的迅速发展,数据中心的算力和存储也在不断迭代,为满足不断增长的需求,数据中心正成为支撑现代信息社会正常运行的关键基础设施。而与此同时,数据中心所消耗的电能也急剧增长,中国电子技术标准化研究院数据显示,2021年全国数据中心能源消耗达到2166亿千瓦时,较2020年增加44%,占全社会用电量的2.6%左右。 传统的数据中心电源架构通常采用12V总线电压,随着服务器功耗逐渐增大,12V总线系统面临着高损耗、架构复杂及高成本等瓶颈,未来或将逐渐转变为48V总线电压系统。而核心元器件负载所需要较低的电压(0.5V~2V),因此从12V直流总线到低压高功耗的处理器需要DC/DC降压芯片提供稳定电源输出及数字调节监控功能。 图1:数据中心电源架构(a:传统12V总线电源架构;b:新兴48V总线电源架构) 资料来源:J.Liang,L.Wang,M.Fu,J.LiangandH.Wang,"OverviewofVoltageRegulatorModulesin48VBus-BasedDataCenterPowerSystems",信达证券研发中心 与此同时,GPU、CPU等算力芯片朝着更高性能升级也对供电系统提出更高要求。算力的提升需要更大的耗电,这对供电电压调节器模块(VRM/Vcore)和负载点电源(PoL)提出了严峻挑战,包括更高的效率、更高的功率密度,以及同时满足处理器di/dt>1000A/us瞬态响应要求。 图2:CPU/GPU对功耗要求逐渐提升 资料来源:矽力杰半导体,信达证券研发中心 多相控制器+DrMOS的多相电源方案目前被公认为是CPU/GPU供电的最佳解决方案。多相Buck电源包含控制器和DrMOS,是一种多路交错并联的同步Buck拓扑,每相Buck对应的半桥MOSFET可由包含驱动和温度/电流检测的DrMOS代替,由一个控制器采集反馈 的电压、电流、温度/错误等信号,并发出各PWM波实现功率的闭环控制。控制器可通过特定协议的通信接口(如PMBus,AVSBus,SVID,SVI2/3,PWM-VID等)和信号指示I/O口,与系统上位机或负载处理器进行信号交互。 图3:基于多相Buck的小占空比供电架构方案 资料来源:矽力杰半导体,信达证券研发中心 DrMOS集成MOSFET和driverIC,有效提升转换效率、提高功率密度、降低器件体积。DrMOS将2个功率MOSFET和driverIC集成在一个芯片中,采用芯片封装工艺,在内部优化功率回路和驱动回路,可以最大程度减少寄生电感和电容影响;另外,系统整体尺寸进一步降低,功率密度大幅度提高,满足高端主板更严苛超频工作,提升整体效率。DrMOS内部增加电流和工作温度检测功能,电流和工作温度信号输出给PWM控制器或CPU/DSP (数字控制器),不但可以进行系统控制和反馈调节,还可以保护功率器件安全工作,提高系统可靠性。 图4:DrMOS采取合封方式有效降低面积、提升效率 资料来源:ASRock,信达证券研发中心 图5:与传统分立设计相比,DrMOS效率高达95%,且能减少功耗、降低温度 资料来源:ASRock,信达证券研发中心 AI服务器有望带动多相电源量价齐升 GPU算力持续升级带来功耗提升,对多相电源的数量和性能提出更高要求。以Transformer为核心的大模型AI路径已被ChatGPT等模型证实,AI或将引领新一轮科技产业革命,而算力芯片作为AI的“基础设施”成为此轮浪潮下的关键。“大参数+大模型”的持续演进以及应用场景的增多都对算力提出更高需求,算力芯片供应商不断推出更高算力的产品,而算力的提升也带来更高的功耗。以GPGPU两大国际龙头的产品为例,英伟达H100NVL最大功耗已经达到800W,而AMDInstinctMI250X最大功耗也达560W。 表1:NVIDIA、AMD主要GPU产品算力和功耗 浮点算力(TFlops)INT8定点算力 厂商 产品 发布时间 FP64 FP32 FP16 (TOPS) 显存 最大功耗 H100SXM 2022 34 67 1979 3958 80GB 700W H100PCle 2022 26 51 1513 3026 80GB 350W H100NVL 2022 68 134 3958 7916 188GB 800W NVIDIA A100SXMA100PCle 20202020 9.79.7 19.519.5 624312 1248624 80GB80GB 400W300W V100PCle 2017 7 14 112 - 32GB 250W V100SXM2 2017 7.8 15.7 125 - 32GB 300W V100SPCle 2017 8.2 16.4 130 - 32GB 250W InstinctMI300X 2023 - - - - 192GB - InstinctMI300 2023 - - - - 128GB - AMD InstinctMI250X InstinctMI250 20212021 47.945.3 47.945.3 383 362.1 383362.1 128GB128GB 560W560W InstinctMI210 2022 22.6 22.6 181 181 64GB 300W InstinctMI100 2020 11.5 23.1 92.3 184.6 32GB 300W 资料来源:NVIDIA,AMD,Tom'sHardware,信达证券研发中心 普通CPU服务器中主板电源价值量约为80美金。普通服务器通常采用两颗CPU,根据CPU的功耗要求配套多套多相电源(一套多相电源由一颗多相控制器+8~12颗DrMOS组成)。根据MPS的测算,一台普通服务器中CPU及内存电源、POL和EFuse等产品的价值量总计约80美金。 图6:MPS测算普通CPU服务器中电源价值量约为80美金 资料来源:MPS,信达证券研发中心 AI服务器中多相电源单机价值量提升约4~5倍。AI服务器在普通服务器的基础上,通常会增加4~8颗GPU,以多相控制器和DrMOS组成的多相电源同样是GPU的供电解决方案,且GPU相较于CPU功耗更高,对多相电源的需求进一步提升。以英伟达H100为例,一颗GPU需要40~50颗DrMOS,而服务器多相控制器通常采用12相方案(1颗多相控制器对应12颗DrMOS),因此多相控制器数量约为4~5颗。考虑一颗DrMOS或多相控制器的价格均为1~2美金(以1美金/颗进行测算),则一颗H100需要多相电源的价值量约为40~50美金。若一台AI服务器搭载8颗H100,则单台AI服务器中多相电源的价值量约 320~400美金,相较于传统服务器而言有4~5倍增量,价值提升显著。 图7:H100中DrMOS的分布 资料来源:NVIDIA,信达证券研发中心 图8:GH200超级芯片中DrMOS和电感的分布 资料来源:NVIDIA,信达证券研发中心 AI服务器加速渗透下,服务器多相电源有望实现量价齐升。在ChatGPT、