打造先进算力网络 推动算力高质量发展 中国移动研究院2023.12 算力已成为数字经济核心生产力 ①事关核心生产要素升级 ②事关数字经济增速 ③事关智能社会发展 ④事关双碳目标实现 算 电 网 水 计算机等设备制造 其他制造业批发零售业 互联网、软件和信… 金融业能源供应 科研和技术服务住宿餐饮业 文教卫生与社会服务 环境和公共设施管理 直接带动产出 间接带动产出 资料来源:国家统计局中国信息通信研究院 00.511.5 2 我国算力规模平均每增长一个百分点,带动数字经济和GDP将分别增长3.5‰和1.8‰ AI催生巨大智能算力需求 16206EFLOPS 41EFLOPS 2018年AI算力需求 2030年AI算力需求 来源:罗兰贝格 智能算力占比逐年提升~70% 51% 41% 201920202021 2023 来源:中国信通院 人工智能的发展对智能算力需求呈指数级增长,智能算力占比超过50%,成为主流算力 80000中国数据中心耗电量及占全社会电量比2.71%3.00% 70000 2.42% 2.50% 60000 2.16% 50000 40000 30000 20000 10000 0 1.76% 1.86%1.96% 2.00% 1.47% 1.50% 1.00% 0.50% 0.00% 2014201520162017201820192020 数据中心耗电量 全社会用电量 过去十年,数据中心用电量以每年超10%速度递增,2022年约占全社会用电量的3% 中国移动算力网络发展历程 算力网络的核心理念 以网强算、算网融合多要素融合、一体化供给任务式服务 通过高速网络将原先分散孤立的算力节点连接在一起,构成立体泛在的一体化算力集群 实现算力协作化、集约化、普惠化 以存算网为基础要素,叠加AI、大数据 、区块链等能力要素,同时综合考虑土地、能源、供水等资源要素 实现多要素融合的一体化供给 用户不用关心资源类型和位置,一点接 入,随需申请,随需使用,随需调整 打开算龙头就可以便捷使用算力 网络无所不达 算力无所不在 智能无所不及 算力网络发展三阶段路径 起步:泛在协同 一站服务、协同运营 协同编排网随算动 发展:融合统一 融合服务、统一运营 算网融合智能编排 跨越:一体内生 一体服务,模式创新 智慧内生算网一体 十四五阶段 2021-20232024-20252025~ 十五五阶段及更长期 算力网络发展主线 中国移动从算网基础设施构建、业务融合创新、创新技术引领等多方面系统化推进算力网络建设和发展 主线一 面向算网基础设施构建 物理空间、逻辑空间、异构空间、多主体算力融通 “4+N+31+X”布局,1100边缘节点打造20ms、5ms、1ms三级时延圈SRv6/G-SRv6打造统一算网底座 主线二 面向业务融合创新 实现算网高效协同,支持CHBN业务融合发展,打造算网全新生态 产品算力化和算力产品化发布算网服务1.0 构筑算网大脑 主线三 面向创新技术引领 实现创新技术引领,打造原创技术策源地 三横两域体系架构提出十大技术发展方向 三十二大核心技术 主线一:面向算网基础设施构建 打通东数西算主动脉 “4+N+31+X”数据中心布局数据中心机架数超120万架 单体最大智算中心5.5EFLOPS 并网算力达1.9EFLOPS 做强边缘算力微循环 省级节点超300个 边缘计算节点超1500余个DCI云专网覆盖300余个地市 向算而生构建网络新架构 打造骨干20ms、省域/区域5ms、城市1ms三级时延圈网络 枢纽节点全光高速直连枢纽节点间带宽向400G演进 技术创新打造网络新能力 SRv6/G-SRv6打造统一算网底座网络切片提供满足确定性连接服务新一代SD-WAN高效分发算力服务数据快递实现长距离高吞吐数据传输 主线二:面向创新技术引领 总线互联 卡间高速通信 算力路由 突破互联网架构协议 数据快递 突破广域传输性能瓶颈 全调度以太 突破无损以太性能瓶颈 新一代SD-WAN Under与Overlay协同 算力并网 实现算力供给侧改革 算力智能内生 计算要素创智能服务 移动算力 5G、6G新增计算面 算力原生 实现应用跨架构迁移 存算一体 突破冯氏架构 算力度量 打破单维算力指标 在网计算 打破算网边界 隐私计算 安全数据分析计算 算力卸载 多算力形态统一底座 400G/800G 超高速大容量全光网络 G-SRv6 统一IP承载协议 空芯光纤 新型光纤介质与系统 算力解构 应用模块化解构部署 50GPON+FTTR 新型接入网架构 云原生 敏捷高效体系 OTN光电联动 新型全光网架构 全光接入 新型接入网架构 应用感知 应用类型识别 空天地一体 突破异构算网融合 主线二:面向创新技术引领:算力原生(1/4) 中国移动原创提出算力原生技术,目标打破“框架+工具链+硬件”紧耦合的智算生态屏蔽底层硬件差异,实现智算应用的跨架构迁移部署 应用层 框架层工具链 Pytorch…… 应用层框架层 编程模型转换、编译、优化 Pytorch…… 跨架构流转的原生程序 •统一编程模型及源源转换 基于SYCL的单源编程模型范式 •跨架构综合编译机制 多级IR互转,图算数融合编译优化 硬件层 XXXX 无法互识跨架构流转 CANN oneAPI CUDA ROCm NeuWare …… 算力原生层 工具链硬件层 原生运行时 程序加载动态链接 CANN oneAPI CUDA ROCm NeuWare …… •原生程序格式规范 Host侧、Device侧指令元语及执行策略的一体承载 •原生运行时算力抽象 跨厂商运行时接口/指令集的可变粒度映射机制 繁冗开发、复杂适配、各自为栈一次开发、一次封装、跨芯迁移 主线二:面向创新技术引领:算力原生(2/4) 跨架构编译优化技术:构建开放集成框架进行多级IR互转编译,对用户所输入的模型计算图和程序代码进行融合编译,逐级流转和优化,生成无感于计算架构的原生程序,最大化兼顾跨架构运行性能 CANN oneAPI CUDA ROCm NeuWare 应用层 框架层 Pytorch…… 跨架构流转的原生程序 原生运行时 工具链 硬件层 …… 编程模型转换、编译、优化 算力原生层 编译器采用LLVM、MLIR等领域标准实现开放式架构 前端:解析SYCL等源码及ONNX等计算图模型 中端:进行跨架构综合优化,对并行策略等进行注入后端:完成原生标准格式代码生成 主线二:面向创新技术引领:算力原生(4/4) 自适应动态运行时技术:为CUDA/Level-Zero/ROCm/CANN等多厂商运行时建立统一抽象接口,并建立灵活接入机制;对异构系统环境、算力内核、内存等计算资源进行注册管控;完成原生程序的加载、解析,保障计算任务与本地计算资源的即时互映射按需执行 CANN oneAPI CUDA ROCm NeuWare 应用层 框架层 Pytorch…… 跨架构流转的原生程序 原生运行时 工具链 硬件层 …… 编程模型转换、编译、优化 算力原生层 算力池化:实现算力设备虚拟化,细粒度切分及远程调用,提升算力利用率,降低碎片化 主线二:面向创新技术引领:算力原生(4/4) 2023中国移动全球合作伙伴大会正式发布智算“芯合”算力原生成果融通智算生态竖井,开辟以软件为核心的智算产业链牵引全新路径 发布《面向智算的算力原生白皮书》 原创提出“两层架构”和“四大核心技术” 三阶段发展路径: 1、异构算力资源池化 2、应用跨架构迁移 3、全局泛在融通 OIF成立开源工作组,牵头国内外多项标准立项 牵头在OIF成立算力原生子工作组 牵头在ITU、CCSA进行标准立项 移动全球合作伙伴大会正式发布:智算“芯合”算力原生平台 降低AI应用向国产化平台迁移成本 突破基础软件领域国产智算生态的发展 繁荣我国自主智算软芯片与软件生态 软件研发:4大组件提供跨架构一站式解决方案 统一编程套件:统一编程模型+标准IDE+计算库 源源转换工具:CUDA→SYCL转译 跨架构编译器:图算融合编译+原生流转文件 自适应运行时:异构设备统一抽象+动态映射执行 应用实践:智算应用在3家智算芯片跨架构部署迁移 软件实现视频分析、图像识别等典型智算应用在英伟达、华为、瀚博等3家智算芯片上的跨架构部署迁移 迁移时间<20s,性能损耗≤15%,CUDA→SYCL转译率 >90% 生态拓展:9家伙伴联合发布算力原生“芯合”计划 推动智算芯片与“芯合”软件自适应运行时对接,扩展智 算芯合产业合作生态 成果发布研发进展 主线三:面向业务融合创新 打造算网大脑 算力网络运营层 算网大脑 网络域能力网关 网络域能力网关 算力网络基础设施层 ... 智能 能力接入 感知接入 编排调度 设计 发布“天穹”算网大脑并试商用,实现多要素融合的智能编排调度 构建算网服务体系 开创任务式新服务 探索新业态新模式 数据快递 东视西渲 云XR 算力并网 中训边推 东数西存 自动驾驶 元宇宙 打造算力产品 升级云网融合产品 ... ... 云XR 云游戏云魔百和 云专线 云互联 5G云梯 打造东视西渲、数据快递、中训边推等任务式服务 总结与展望 1、算力网络发展的基础在于“技术策源”,联合业界加强算力原生、算力路由、存算一体等跨学科交叉技术的研究,打造算力网络原创技术新高地 2、算力网络发展的重点在于“继往开来”,在做好技术原创的基础上,还要解决好科学的工程化问题,以打造新型信息基础设施为目标,全面支撑国家东数西算等重大工程向纵深发展 3、算力网络发展的核心在于“产业共赢”,凝聚产学研用力量,加快构建统一技术路线与标准体系,促进新技术转化和产品落地 14