智算如何引领新型电力系统 目录 前言2 第一章:文献综述与方法论4 ●美国的算力增长预期,分歧重点在市场5●中国算力增长预期,不确定性主要在技术5 第二章:测算方法与结果7 ●中国智能算力每年增长70%7●乐观情景下国产芯片有望突破8●2030年中国智算年用电最高1.3万亿度9●智算中心成为用电量增长主力10 第三章:中国净零碳电力算力地图11 ●智算中心发展初期主要在绿电供给不充分的东部12●2030年清洁电力发电量预测12●智算用电需求的动态匹配13●绿色算力电力区位条件15 第四章,智算加速建立新型电力系统17 ●24/7全天候“智”“能”调度17●绿电直供与跨区域交易18●源网荷储碳一体的配电网与微电网18●虚拟电厂19 结论:让智算率先实现净零碳电力21 附录22 关于报告23 ●未尽研究23●环球零碳23 前言 能源与机器,自从技术革命以来,从来都不可分。新能源与机器学习正在走向融合,它们符合一个共同的技术和经济规律,效率上升,成本下降,而需求增长更快,产生了杰文斯悖论的效应。 如果能源的无限需求内生于经济发展,唯一的选择,就是使用绿色和清洁的能源。 杰文斯是19世纪英国工业革命期间的一位经济学家。他发现,当煤炭的使用效率不断提升时,对煤炭的需求不仅没有下降,反而在煤炭的应用和相关领域产生了大量的创新,渗透到各行各业,导致煤炭的消耗量上升。杰文斯悖论在历次技术与工业革命中持续上演,蒸汽机、内燃机和燃气轮机的效率不断提升,但人类对于化石能源的需求也持续增长了两百多年。杰文斯悖论揭示了资源、技术、经济之间的基本关系。 摩尔定律是信息技术革命时代的杰文斯悖论。单位面积芯片上的晶体管数量每18个月左右增加一倍,60年来相当于算力的成本至少下降了10亿倍,推动经济与社会进入数字时代。 而在加速计算逐步占据主流的深度学习“黄金10年”,GPU的效率提升了千倍。尽管如此,在整个经济与社会向数字化与智能化转型的过程中,对于智能算力的需求在绝对数量和相对占比的意义上,不但没有减少,反而在加速增长,每个季度翻番。这在很大程度上是由于算力更加密集的基础设施和应用正在涌现。如果考虑到未来的物理AI以及元宇宙,对于算力的需求几乎是无限的。 从技术上来讲,摩尔定律和黄氏定律可以也必须持续下去,但它必须投入更大的研发资金以及消耗更多的能源,能源革命并没有改变杰文斯悖论。而经济和商业规律决定了,这些投资体现为更高的能量密度和算力密度的基础设施,必须以更广泛的创新和应用实现回报(ROI),新的生产力得以形成,经济增长得以实现。这就是AI时代的杰文斯悖论的商业和经济基础。杰文斯悖论也说明了原有的经发展模式是不可持续的:如果能源的无限需求内生于经济发展,唯一的选择,就是使用绿色和清洁的能源。 可再生发电边际成本趋近于零,智能算力边际成本趋近于零,这两大趋势合龙,将引发广泛的应用创新,渗透到经济与社会中,进一步带动对于能源和算力需求的同步上升。生成式AI革命,与能源革命耦合在一起,也将带来能源管理方式的根本变化。算力革命与能源革命将互相迭加、融合、增强;如果清洁能源供应不足,电力基础设施不向新能源转型,人工智能的发展将会被“卡脖子”。 计算的本质是能源的处理形式,计算过程也是能量转换和使用的结果。AI所带来的海量计算,将与可再生能源一起,推动新一轮信息与能源革命。而这一轮大模型创新所遵循的扩展定律(scaling law),即更多的数据和更大的算力推动模型越来越大,越来越接近通用人工智能(AGI),产生了大数据-大算力-大模型-大电力的范式。 中国在新能源革命中已经处于领导地位,也是全球第二智能算力大国。中国正在部署AI+战略,成为新质生产力中的一个战略性前沿领域。目前中国正处于风光等可再生能源的“黄金10年”,AI所带来的清洁电力需求,需要顺应中国的能源转型,实现2030年碳达峰及2060年碳中和的目标。 本报告估算出中国到2030年所需要的智能算力总量,相对应的电力需求总量,尤其是在中国电力增量中所占的比重。我们假设中国智算中心2030年的目标是达到世界先进水平,之后所消耗的能源以绿色和洁净电力为主,在各行业中率先实现净零碳排放。在国家东数西算以及八大枢纽和十大集群的总体布局下,我们进一步分析各省的智算能力和清洁电力资源的现状及未来,将如何在支持国家人工智能发展大计的同时,推动本地的经济数字化与智能化。与此同时,我们关注到智算在各地爆发式增长给电力系统以及控制碳排放带来的短期挑战,以及算力与电力的协调发展,对于引领和加快新型电力市场建设的意义。 计算的本质是能源的处理形式,计算过程也是能量转换和使用的结果。AI所带来的海量计算,将与可再生能源一起,推动新一轮信息与能源革命。而这一轮大模型创新所遵循的扩展定律(scaling law)产生了大数据-大算力-大模型-大电力的范式。 文献综述与方法论 第一章: 全球数据中心用电量将在AI的推动下大幅增长,一直受到关注。从2023年以来,由于生成式AI的迅猛发展,美国尤其为“电力危机”感到焦虑,而中国的人工智能要在碳达峰目标的约束下追赶美国,算力与电力问题需要重估。 算力需求增长、能耗及排放增加的速度,始终快于算力效率、功耗效率、排放效率提升的速度,这是导致用电量会持续增长的根本原因。生成式AI在内容生成与推理方面,创造出越来越有价值的应用,而这些应用的算力、能耗与排放的密集度也迅速上升。 来自不同行业和专业背景的机构,对智能算力的电力消费进行了为数众多的研究,基本逻辑大同小异:先根据芯片等硬件的算力与功率,估算出数据中心的用电量;再根据算力增长、芯片能效(单位时间内完成的计算量与消耗的电能之间的比率)提升,以及数据中心能效(PUE,数据中心总能耗与关键IT设备能耗的比率,数字越小越接近1,能效越高)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。 智能算力的提供者及主要使用者,如科技企业、电信企业、政府、以及日益数字化的许多行业,都提出了100%使用绿色电力、实现碳中和的目标和路线图。而获得绿电及清洁电力,尤其是直接接入供应的绿色电力,并且建立起新型能源管理系统,是实现绿色智算中心的关键。 其中,无论在中国,还是在美国,数据中心的能效提升是确定性较强的部分。PUE都受到监管机构或ESG政策的约束,近十年来全球数据中心平均PUE仅从1.65降至了1.58,并非影响近年来数据中心用电量增长的核心因素。 这些研究报告,对于人工智能技术最发达、电力市场化程度最高的美国研究比较充分,为关于中国的研究提供了基准性的参考,但忽视了中国所面临的芯片系统技术的挑战及能源电力市场的差异性。这些报告对美国智能算力增长和电力需求的预期并不一致,而中国面临的首要问题是如何克服芯片能效提升的瓶颈。 美国的算力增长预期,分歧重点在市场 英伟达GPU芯片成为目前智算中心的主流算力硬件,占比90%左右。因此,全球范围内芯片能效提升趋势相对明确,可预见的将来与英伟达GPU迭代周期同步,未来有望一年一次更新。伴随着向更低精度的扩展,从P100到B200的8年间,训练同一个模型的能耗,理论上目前已经降至最初的1/400左右。 因此,导致各方预测结果分歧较大的原因,主要在于对AI算力增长的预期不一致。这既取决于算力需求的增长,也取决于算力供给的增长,还取决于客户预算的增长能否赶得上前两者的增长,以及电力电网建设的增长赶不赶得上前三者的增长。不少年初的研究低估了去年英伟达GPU的出货量。此外,其中算力需求的增长,既包括训练需求的增长,也包括推理需求的增长,两者都存在较高不确定性。 因此,部分报告假定了不同的AI算力增长情景,也产生了不同的用电增长估算结果。高盛认为届时美国AI用电占比约20%,semianalysis则认为可能超过60%。在不同AI算力增速预期下,前者估算到2030年,美国数据中心用电占比将从2023年的3%升至8%,后者估算到2028年该占比将升至超过14%。 中国算力增长预期,不确定性主要在技术 对于中国而言,国产芯片的迭代速度与产能瓶颈,即芯片能效提升预期,以及算力增长预期中的算力供给问题,才是最敏感的影响因素。因此,重估中国AI算力与电力在不同情景下的预期,主要从较不确定的芯片创新的角度,而非美国的较确定的算力增长的角度。 中国目前无法通过官方渠道同步获得英伟达最先进的GPU。美国降下的“硅幕”,限制芯片设计、制造与流通的多个环节,试图将中国先进算力遏制在A100水 平以下。但中国在从国际市场上获取符合美国出口禁令标准的芯片的同时,国产芯片也在迅速补位,通过DUV多重曝光等技术制造的等效7nm芯片已获行业验证,理论上这也适用于探索制造等效5nm芯片。接下去的问题就是良率提升速度与产能爬坡速度,根本上取决于中国建立起一个基本替代西方先进制程芯片的产业链,解决各个环节卡脖子问题。这需要时间和耐心。 保守来看,如果鸿沟短期内无法逾越,中国的AI算力长期依靠较低能效的芯片,且芯片能效无法持续提升,那么相同算力规模的用电量需求就会大增。电力换算力成为一种选择,以保证在AI领域的竞争力。但就总量而言,中国电力的装机总量约为美国2.4倍,发电总量约为美国的2.1倍,其中,可再生能源发电新增装机超过全球的一半,累计装机规模占全球比重接近40%,绿色电力供给总量不是问题。 乐观来看,如果中国能够突破封锁,建立起比较完整的芯片产业链,芯片技术持续迭代升级,能效持续提升,那么,以中国制造“过剩”的能力,决定用电量的将是算力需求而不是供给。中国三大城市群已出台的智能算力基建规划,总规模早已超过全国。大模型最大的应用市场就在中国。 测算方法与结果 第二章: 从2023年到2030年,中国智能算力规模将以每年70%的复合增长率持续攀升。国产芯片将成为智能算力的主要来源,技术保守情景下全部采用等效A100,以电力换算力,但更有可能以落后美国4年左右的代差持续迭代,提升能效。至2030年,全国智算中心年用电量在0.6万亿度-1.3万亿度,约占当年全社会用电量的5%-10%。 中国智能算力每年增长70% 去年底,中国提出了《算力基础设施高质量发展行动计划》与《深入实施“东数西算”工程,加快构建全国一体化算力网的实施意见》。全国各地都在摸底算力,行动快的省份,已经推出了自己的基建方案。 部分省市规划的智算规模总量,超过了全国的计划目标。“高质量发展行动计划”明确指出,到2025年,中国数据中心的算力规模超过300 EFLOPS,其中智能算力占比达到35%,即105 EFLOPS。而“八大算力枢纽节点”中的京津冀、长三角和粤港澳三大枢纽,规划到2025年的智能算力规模已经接近120EFLOPS。 智算规模实际部署速度,快于计划文件的目标。“高质量发展行动计划”原定至2023年底,智能算力达到66 EFLOPS;而按照工信部今年披露的数据,去年智算规模已达70 EFLOPS,同比增速超过了70%。 智算规模加速部署,既是中美AI竞争的反映,也是中国经济增长向“新质生产力”要效率的缩影。在国家“适度超前建设算力基础设施”的鼓励下,中国智能计算中心算力规模保证70%的增速是合理且必要的。到2030年,中国智算规模将达到2886 EFLOPS。 乐观情景下国产芯片有望突破 芯片“硅幕”为中国芯片产业创新提供了外部动力与内部市场。国产GPU、FPGA与ASIC等各类AI加速芯片,将逐步成为近3000 EFLOPS的智能算力的主要来源。这些芯片需要在总量与结构上满足大模型及其AI应用的训练及推理的需求。一般而言,训练对芯片性能的要求更为苛刻。 即使保守地看,国内芯片厂商已经具备了设计与制造等效英伟达A100芯片的能力,产能也在提升。但中国更有可能在技术创新与政策支持下,走向乐观情景。国内芯片产业以相比美国4年左右的代差迭代升级,即在2027年起全部使用更高能效的等效H100,到2029年全部使用等效B200。一旦中国建立起自主的芯片及算