国家“东数西算”工程背景下新型算力基础设施发展研究报告 1 国家“东数西算”工程背景下新型算力基础设施发展研究报告 单志广何宝宏张云泉著 出品单位:支持单位: 国家“东数西算”工程背景下 新型算力基础设施发展研究报告 编写委员会 顾问: 陈润生 陈国良 郑纬民 袁国兴 主编: 单志广 何宝宏 张云泉 执行主编: 安静 王海峰 张广彬 编委: 沈文海 陈学斌 方娟 贾海鹏赖能和袁良 张延强 王丹丹 陈栩 涂菲菲刘殷戴彧 宋心荣舍日古楞徐凌验张翼李英浩特别鸣谢:清华大学益企研究院 参编单位:国家信息中心 信通院云大所中科院计算所清华大学 2 国家气象中心 目录CONTENTS P04“东数西算”定义和解读 P08前言 P09第一章东数西算对算力新基建的影响 P10数据中心布局向供需协调有序、综合能效优化演进 P13东数西算向时延要求低、存算要求高类型应用场景拓展P15算力结构呈现多元算力协同、算网一体化发展态势 P16产业链上下游集聚发展,生态体系逐步壮大完善P16绿色低碳技术推广应用,清洁能源供给不断加大P18新老节点加快有序衔接,强化算力网络智能调度P19数字技能水平要求提升,技能人才需求不断凸显 P21第二章算力新基建呈现的10大挑战和实践 P23算力基础设施化保障资源多元供给P32关键信息基础设施的安全性要求P36信创产业化:国产化、自主化 P38算力设施整体能耗偏高,绿色低碳应用仍需持续推广P43高密度机柜功率密度提升 P46算力智能调度:跨区域、跨云、云边调度P50多元算力多样计算 P52算力服务成为新业态 P54原生应用:云原生、AI原生P57规模化和算网融合 P63第三章展望·面向2030年的算力基础设施 P64数字文明时代加速到来,要求算力基础设施资源充沛、泛在普惠P65隐私计算为代表的技术为组织间数据流通提供解决方案 P67可信隐私计算是未来数据要素化的理想技术方案之一P69Web3.0驱动规模化、泛在化的智能算力构建 P71第五范式AIforScience对算力的需求 P73大模型成为人工智能工程化重要方向,智能算力需求几何级增长P75边缘创新与新兴应用 3 P76自动驾驶进入无人化新阶段,云边端高效协同 “东数西算”定义和解读 一、东数西算工程 今年2月,国家发展改革委会同中央网信办、工业和信息化部、国家能源局等有关部门,同意在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏8地启动建设国家算力枢纽,并设立10个国家数据中心集群,正式启动“东数西算”工程,构建全国一体化大数据中心协同创新体系。 与“西气东输”“西电东送”“南水北调”等工程相似,“东数西算”是一个国家级算力资源跨域调配战略工程,针对我国东西部算力资源分布总体呈现出“东部不足、西部过剩”的不平衡局面,引导中西部利用能源优势建设算力基础设施,“数据向西,算力向东”,服务东部沿海等算力紧缺区域,解决我国东西部算力资源供需不均衡的现状。 图片来源:https://www.ndrc.gov.cn/fzggw/jgsj/gjss/sjdt/202209/t20220923_1336061.html?code=&state=123 二、东数西算内涵 “东数西算”是“全国一体化大数据中心协同创新体系”的一个下辖概念,而后者旨在推进技术、业务、数据融合,实现跨层级、跨地域、跨系统、跨部门、跨业务的数据协同管理和服务,其实现方式不是固定不变的。因此,不一定过度强调“东数西算”,面对不同应用场景,还可能有东数东算、南数北算等模式,应因地制宜。但无论哪种模式,都有着共同的目标:一是促进数据中心资源最大化共享、流通和利用,二是通过数据中心的系统化布局,促进国家碳达峰、碳中和战略实现。 三、东数西算与算力基础设施化 算力代表了对数据的处理能力,是数字化技术持续发展的衡量标准,也是数字经济时代的核心生产力。东数西算项目是促进算力、数据流通,激活数字经济活力的重要手段。 东数西算首次将算力资源提升到水、电、燃气等基础资源的高度,统筹布局建设全国一体化算力网络国家枢纽节点,助力我国全面推进算力基础设施化。 算力基础设施化并不简单等同于算力总量的拉升。算力的基础设施化并不是简单的算力堆砌,当前各类机构的算力总量测算方式都是将各行业、各公司的私有算力进行累加,甚至还会加上手机终端等移动端的算力,这些算力确实能够服务一定的群体,但算力资源并不能面向全社会提供统一一致的服务。 四、东数西算与绿色节能 东数西算是促进绿色节能,助力实现碳达峰、碳中和目标的重要手段。目前东部算力需求旺盛,但东部地区在气候、资源、环境等方面不利于低碳、绿色数据中心的建设。通过算力基础设施的西部迁移,可以充分发挥西部区域气候、能源、环境等方面的优势,引导数据中心向西部资源丰富地区聚集,扩大可再生能源的供给,促进可再生能源就近消纳,加强数据、算力和能源之间的协同联动,助力我国数据中心实现低碳、绿色、可持续发展,完成碳达峰、碳中和目标。 “东数西算”工程聚焦创新节能,在集约化、规模化、绿色化方面着重发力,支持高效供配电技术、制冷技术、节能协同技术研发和应用,鼓励自发自用、微网直供、本地储能等手段提高可再生能源使用率,降低数据中心电能利用率(PUE),引导其向清洁低碳、循环利用方向发展,推动数据中心与绿色低碳产业深度融合,建设绿色制造体系和服务体系,力争将绿色生产方式贯彻数据中心全行业全链条,助力我国在2060年前实现碳中和目标。 五、“东数西算”工程“五个一体化”的目标建设 东数西算把东部地区的非实时算力需求以及大量生产生活数据输送到西部地区的数据中心进行存储、计算并反馈。在其上则是希望构建更绿色、更平衡和更高效的国家算力网络体系,以满足新时代各行各业数字化转型、数字技术与生活场景加速融合所带来的海量计算、传输、存储需求,最大化实现数据中心产业绿色集约发展,推动资源统筹利用和西部数字经济建设。 •网络一体化围绕集群建设数据中心直连网,建立合理网络结算机制,增大网络带宽,提高传输速度,降低传输费用。围绕集群稳妥有序推进新型互联网交换中心、互联网骨干直连点建设。 •能源一体化从国家双碳战略整体规划出发,充分发掘西部丰富的风光等可再生资源,应对好可再生能源波动性问题,扩大清洁能源市场化交易范围,促进建立清洁能源消纳的市场化机制。从整体规划层面对数据中心集群进行统一能耗指标调配。 •算力一体化在集群和城区内部的两级算力布局下,推动各行业数据中心加强一体化联通调度,促进多云之间、云和数据中心之间、云和网络之间的资源联动,构建算力服务资源池。 •数据一体化建设数据共享开放、政企数据融合应用等数据流通共性设施平台。试验多方安全计算、区块链、隐私计算、数据沙箱等技术模式,构建数据可信流通环境。 •应用一体化开展一体化城市数据大脑建设,选择公共卫生、自然灾害、市场监管等突发应急场景,试验开展“数据靶场”建设,探索不同应急状态下的数据利用规则和协同机制。 关于“东数西算”工程“五个一体化目标”阐述来源: 中国工程院院士、清华大学计算机科学与技术系教授郑纬民https://www.ndrc.gov.cn/xwdt/ztzl/dsxs/zjjd1/202203/t20220321_1319866.html?code=&state=123 前言 2022年初,国家发展改革委、中央网信办、工业和信息化部、国家能源局联合印发通知,同意在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏等8地启动建设国家算力枢纽节点,并规划了10个国家数据中心集群,标志着“东数西算”工程正式全面启动。 数据中心不仅是算力的聚集地,也是数据应用的发祥地,更是企业数字化转型的根据地。2022年发布的《“十四五”数字经济发展规划》第一条支线即为底层信息网络基础设施建设领域,包括5G、数据中心、光纤宽带等,可以理解为此前反复强调的“新基建”的延续。 东数西算工程从国家战略、技术发展、能源政策等多方面综合考虑,将算力资源提升到水、电、燃气等基础资源的高度,统筹布局建设全国一体化算力网络国家枢纽节点,在实现数据中心一体化协同创新的要求方面,给出了高质量的解决方案,助力我国全面推进算力基础设施化,其战略价值已经被大家认同。但在具体实施落地过程中,需要解决诸多问题,诸如实现数据中心有效整合、优化算力布局,降低算力成本、完成算力调度、实现算网融合、政府作用与市场力量有机结合等关键问题。 为此,中国智能计算产业联盟、益企研究院基于实践调查、探索研究后提出了几个维度的洞察,并分析东数西算对新型算力基础设施发展的影响、新型算力基础设施的技术架构的迭代和演进,以及如何通过技术驱动提升算力新基建的竞争力。 国家“东数西算”工程背景下新型算力基础设施发展研究报告 9 国家“东数西算”工程背景下新型算力基础设施发展研究报告 CHAPTER1 东数西算 对算力新基建的影响 数据中心布局向供需协调有序、综合能效优化演进 数据中心按照规模,分为超大型数据中心、大型数据中心和中小型数据中心。按照主要处理的业务类型,又可分为边缘计算类、低时延类、中时延类和高时延类。数据中心建设作为资本密集、技术密集型投资,数据中心地理位置的选择与其投资规模、投资成本、数据中心类型、服务质量、经济效益等因素紧密相关。随着全国一体化大数据中心体系总体布局的实施,在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏启动建设8个国家算力枢纽节点,并规划了张家口集群、长三角生态绿色一体化发展示范区集群、芜湖集群、韶关集群、天府集群、重庆集群、贵安集群、和林格尔集群、庆阳集群、中卫集群等10个国家数据中心集群。重点从顶层设计层面加强数据中心布局、算力、数据、网络、电力、能耗等方面的全国性统筹规划、一体化发展,数据中心的布局也将更加规范和优化。数据中心在选址布局时也将呈现如下变化。 一是数据中心选址向算力需求中心聚集。当前我国数据中心分布以大湾区、长三角、京津冀经济人口等较发达地域为主,在用数据中心中约80%集中在用户规模较大、应用需求强烈的互联网骨干节点所在省市及周边人口稠密、经济发达、总部企业密布一线城市。截至2021年底,北京及周边、上海及周边的数据中心机架数量排列分列一二。 图片来源:《2021中国云数据考察报告》 01 数据中心选址 向算力需求 中心聚集 02向综合能效 数据中心选址 03向用户终端 数据中心选址 最优聚集 靠近 但是随着北京、上海、广州等一线城市土地、能耗指标日益缩紧,对数据中心的政策约束愈加严格,已建数据中心已远远不能满足城市经济发展对算力的需求,一线城市周边地区逐渐成为互联网数据中心的首要选择。例如,紧邻北京的张家口、廊坊,靠近上海的南通、昆山,距离广深不远的韶关、云浮、清远等都是数据中心密集落户的地区。阿里云五大超级数据中心选址乌兰察布、张北、南通、杭州、河源,均位于在中心城市周边。随着10个数据中心集群的规划建设,数据中心供给结构优化,扩展算力增长空间,政策方面也明确要求对于符合条件且纳入国家枢纽节点数据中心集群范围的建设项目,积极协调安排能耗指标予以适当支持,实现大规模算力部署与土地、用能、水、电等资源的协调可持续。 二是数据中心选址向综合能效最优聚集。数据中心的主要运营成本包括土地、水、电、运维等要素,运营成本因为区位的不同有显著的差异,其中,高能耗导致的高电力成本是制约数据中心发展的主要因素之一。在土地、气候、政策、能源供给等优势加持下,数据中心建设选址向可再生能源丰富、气候适宜、数据中心绿色发展潜力较大、综合能效最优的节点城市聚集,着重提升算力服务品质和利用效率,充分发挥资源优势,夯实网络等基础保障,积极承接全国范围需后台加工、离线分析、存储备份等非实时算 力需求,打造面向全国的非实时性算力保障基地。通信运营商、互联网企业等也纷纷将数据备份存储、大数据处理等对网络时延要求较低的业务向综合能效优势地区转移。例如,内蒙古乌兰察