[在此处键入] 前言 数 字经济时代下,我国算力规模持续增长,但也面临算力分布不均、供需失衡等问题,导致社会算力利用率难以提升。在2021年中国移动《算力网络白皮书》中, 中国移动首次提出“算力并网”新理念。希望通过算力并网,广泛汇聚多方算力资源,创新商业合作模式,助力盘活社会算力,提升社会算效,实现算力普惠。 本白皮书是中国移动对算力并网发展背景、核心理念、商业模式、技术模式以及并网创新实践案例的系统阐述,希望联合产业各方打造算龙头,共同推动算力成为惠普级社会服务,助力实现“网络无所不达、算力无处不在、智能无所不及”的愿景。 本白皮书基于中国移动集团与新华三、浪潮、中科曙光、亚信科技、玻色量子、华为以及各国家级计算中心等行业伙伴广泛开展的技术交流和商业合作实践,持续积累沉淀,由中国移动集团研究院联合移动专业公司和省公司共同编写。 本白皮书的版权归中国移动所有,未经授权,任何单位或个人不得复制或拷贝本白皮书之部分或全部内容。 3.2.2模式2编排管理层对接模式13 目录 目录 1概述1 1.1政策形势1 1.2算力并网理念1 1.3发展现状2 2算力并网商业模式和业务场景4 2.1算力并网产业角色4 2.2商业合作模式4 2.3业务场景6 2.3.1通算场景6 2.3.2超算场景6 2.3.3智算场景7 2.3.4量子计算场景7 2.4服务模式8 2.4.1资源式8 2.4.2平台式8 2.4.3任务式8 3算力并网技术模式10 3.1算力并网总体架构10 3.2算力并网技术对接模式12 3.2.1模式1运营层对接模式12 目录 3.2.3模式3云原生算力纳管模式14 3.3算力并网关键技术15 3.3.1算力度量15 3.3.2算力封装16 3.3.3泛算调度17 3.3.4可信交易17 4中国移动算力并网创新实践案例18 4.1基于CFITI的多模式可信算力并网探索实践18 4.2杭州智算中心和“乌镇之光”超算并网实践19 4.3国家超级计算昆山中心并网实践20 4.4国家超级计算无锡中心并网实践21 4.5结合区块链技术的国家超算济南中心并网实践21 4.6结合工业互联网的中原人工智能计算中心并网实践22 4.7玻色量子计算并网实践23 4.8国际跨境多云算力互连并网实践24 4.9基于西部算力联盟的并网实践25 5展望与呼吁27 参考文献28 缩略语列表29 1概述 1.1政策形势 随着我国数字经济的发展,全社会对数据存储、计算、传输和应用的需求大幅增长,数据中心已成为支撑各行业“上云用数赋智”的重要新型基础设施。国家陆续出台系列政策文件,充分开展对算力多样性和区域性均衡共享服务的政策引导。《“十四五”数字经济发展规划》中提出,要优化升级数字基础设施“加快实施‘东数西算’工程,推进云网协同发展,强化算力统筹和智能调度。 为推动我国数字经济健康稳步向前,缓解东部热点地区土地、能源紧张,充分利用西部地区广茂土地和可再生能源,实现算力基础设施区域协同、绿色集约、自主创新、安全可信等发展目标,近年来国家围绕数据中心的算力统筹规划,连续发布系列指导政策,提出了以“东数西算”为核心概念的多层次、一体化数据中心全新布局。2021年5月,国家发展改革委、网信办、工信部、国家能源局四部门联合印发《全国一体化大数据中心协同创新体系算力枢纽实施方案》,明确提出布局全国算力网络国家枢纽节点,启动实施“东数西算”工程,构建国家算力网络体系。2022年2月17日,国家发改委、工信部等四部委联合印发通知,进一步明确“东数西算”工程行动计划,在京津冀、长三角、内蒙古、甘肃等8地启动建设“4+4”国家算力枢纽节点,并规划了10个国家数据中心集群,标志着我国“东数西算”工程正式拉开序幕。 同时,面向超算与智算资源的全局统筹规划,国家也陆续出台了系列指导政策。2022年8月15日,科技部、财务部公布联合制定《企业技术创新能力提升行动方案(2022-2023年)》,提出加快推动国家超算中心、智能计算中心等面向企业提供低成本算力服务。2023年5月,科技部启动国家超算互联网部署工作,22家单位成立超算互联网联合体,用互联网思维运营超算,将全国众多超算中心通过算力网络连接起来,构建一体化算力服务平台。 1.2算力并网理念 数字经济时代下,我国算力规模持续增长,但是算力分布不均、供需失衡 1概述 等问题,导致社会算力利用率难以提升,大量闲散算力资源亟待盘活使用。截至2022年底,我国算力总规模超180EFLOPS,存力总规模超过1000EB,算力核心产业规模达到1.8万亿元,并保持30%以上的年增长率,但算力利用率仅30%,大量算力仍处于闲置状态[1]。因此国家大力推动建设算力网络,整合算力资源,解决算力布局不均衡、结构不合理等问题。中国移动深度把握行业发展趋势,推动社会算力汇聚,创新算网服务,提出了“算力并网”新理念。 算力并网是一种基于算力度量、泛算调度和可信交易等关键技术,充分发挥算网优势,广泛汇聚多方算力,推动算力普惠和高效服务的创新技术体系及服务模式。算力并网旨在推动实现社会算力融合供给,构筑新型算网服务能力体系,支撑一体服务,逐步推动算力成为与水电一样,可“一点接入,即取即用”的社会级服务。 1.3发展现状 当前,围绕着八大国家算力枢纽节点,各地政府陆续联合企事业单位相继开展区域性探索实践。据不完全统计,目前全国已发布或建设十余个与算力调度相关的平台,如北京市通管局联合信通院发布算力互联互通验证平台、上海市经信委联合上海超算中心发布上海市人工智能公共算力服务平台、贵州省大数据局联合云上贵州和中软国际云智能业务集团等发布贵州枢纽调度平台,以及郑州市政府联合中科院计算所规划建设中的郑州城市算力网。这些平台主要目标均为实现多层级、多主体、异构算力节点纳管、资源调度和算力交易,正处于功能完善中状态。 中国移动自2021年提出算力并网概念之后,系统性开展并网创新技术攻关和国内外并网服务实践。在技术攻关方面,目前,已基于多样化并网技术模式,构建了一套完整的并网技术体系。在国内实践方面,2022年末,依托算力网络创新试验示范网(CFITI)完成了算力并网原型平台的研发和应用探索,平台结合“中移链”区块链平台,联合紫光云、曙光、浪潮等多方合作伙伴完成算力并网试点验证。同时,在浙江、江苏、河南、山东等地陆续开展了多种并网合作模式探索,与“乌镇之光”超算中心、国家超级计算昆山中心、国家超级计算济南中心、杭州人工智能计算中心及中原人工智能中心等完成并网服务实践。 2023年8月,中国移动发布“百川”算力并网平台,实现科学装置和商用能力并举,与十余家行业伙伴展开并网合作,已接入超过1.9EFLOPS的社会算力,同时正在与各国家级智算、超算中心开展并网对接,预计并网后的算力规模超9.5EFlops;在国外实践方面,已实现与AWS、Azure、谷歌云、阿里云、华为云、腾讯云等知名国际算力供应商对接互通,实现对散布于全球数百个POP点的通用算力及公有云商增值服务的集中汇聚和一点服务。 此外,在CCSA推进《算力网络运营管理总体技术要求》、《算力网络运营管理运营服务系统技术要求》、《算力网络运营管理算力调度管理技术要求》、 《算力网络算力节点能力度量及评估方法》等系列标准项目,通过标准牵引,推动行业达成共识,加快多方并网健康生态构建。 2算力并网商业模式和业务场景 2.1算力并网产业角色 未来,算力并网生态总体呈工字型架构,如图1所示,是包含了算力供给方、算网运营方、算网消费方的共同体。 图1算力并网产业生态示意图 算力供给方:参与者主要为算力资源的拥有者,如云服务厂商、电信运营商、IDC运营商、超算、智算中心、中小企业闲置算力以及拥有泛终端设备(如个人PC、家庭网关、工业网关等)的个人和行业。 算力网络运营方:参与者应为中立可信的运营者,如电信运营商、政府认可的运营企业等。算网运营方通过构建并网服务平台,搭建供给方和消费方的桥梁,提供算网一体化产品,同时提供账户管理、运行监测、编排调度、算力交易、体验反馈等服务功能。 算网消费方:参与者主要为互联网厂商、行业生产单位、政府部门、科研机构和个人。算网消费方通过调用智简无感的算网服务,提升业务质量和效率。 2.2商业合作模式 为推动算力网络产业链繁荣发展,需联合社会算力供给方,共同打造算力类型多样化、算网大脑智能编排调度、更高性能和更低成本的多元化算力产品, 基于统一算龙头交易门户为客户提供集网络、算力、运维的一站式算力服务。这些需求进一步促进了现有的算力类型、组织模式以及运营模式产生变革: 算力类型:由单一、高成本向多元化、低成本演进。一方面,对于低成本算力资源,如社会剩余算力或闲时通用算力资源等,将其汇聚到运营方的质算与惠算模式1对外提供服务。另一方面,对于“人有我无”的特色算力资源,如超算、智算及量子计算算力等,为了平衡算力能力供需,发挥网联效益,也可按需联同运营方,向特定算网消费方提供服务。 组织模型:由单一主体向多主体协作演进。算力并网的算力供给方合作对象类型多样,包括:一是大型云服务商,如阿里云、腾讯云、华为云、百度云等;二是超算、智算资源提供商,如各国家级和省市级的超算、智算中心等;三是其他自有算力资源提供商,如科研机构、拥有云资源科研环境的高校等。 运营模式:由独立运营向合作共创演进。运营方通过与算力供给方开展分工协作,为客户提供多元化、一站式的算力服务,建立起价值共创合作体系,共享资源,共担职责,共享收益。 为了应对以上变革,算力并网催生了新型商业合作模式: 电商模式:也称为代理模式或者电商代销模式,算力供给方将以算力资源形式为主的算力委托给算网运营方,通过运营方统一平台进行销售。在此模式下,资源归属一般应仍为算力供给方所有,服务品牌可由运营商所有,也可仍为算力供给方所有,算力资源所需网络服务、后续运维支撑以及产品定价由双方协商而定。 集成模式:算网运营方作为总集成商,集成算力供给方的算力资源,并集成其他合作伙伴的软硬件、SaaS服务等能力,为客户提供端到端的系统解决方案。在该服务模式下,通常品牌及后续运维服务由运营商提供,产品定价由双方协商确定。 赋能模式:算网运营方汇聚纳管算力供给方的闲置算力资源,并赋予闲置算力更大的利用潜力和空间。通过运营方的一体化服务平台,为 1详见2.4服务模式中任务式服务 客户提供端到端算网一体化服务保障,算力供给方按约定提供所需运维支撑。在此模式下,服务品牌和产品定价通常由运营方所有。 2.3业务场景 目前行业中算力的类型分为通用算力、超算算力、智算算力,以及量子计算等新型算力,基于这些算力类型的业务场景也各有其特点。 2.3.1通算场景 通用计算简称通算,通常是指基于互联网的分布式计算模式,区别于智算、超算、量子等需要特殊硬件的算力,依托通用CPU服务器或云主机提供云计算或云原生模式的跨多云主体服务。可应用于资源管理、容灾异地备份、程序开发、游戏平台、网络媒体、应用运行、个人主机等多种行业领域。 通用算力并网可面向更低成本,拉通全国算力中心,实现算力统一调度管理;优化业务高需求地区和资源低成本地区的算力布局,推动落实国家“东数西算”工程;盘活社会闲散算力,有效推动算力普惠。 2.3.2超算场景 超级计算简称超算,也被称为高性能计算(HPC,HighPerformanceComputing),通常是指一种满足利用大规模计算资源解决复杂问题的计算需求的算力。通常应用于需要处理大规模数据、需要高度并行计算或需要快速计算的领域。 超算的典型业务场景包括科学研究、工程仿真、药物研发、金融分析、大数据分析、天气预报、地震模拟、基因组学及人工智能等场景。通过利用HPC的强大计算能力,可以加速科学研究、提高生产效率、改善决策过程,并推动技术和创新的进步。 目前超算资源在国家超算中心、高校以及科研院所自建超算中心之间分布不均,存在算力“孤岛