算力网络推动算网融合共生 中国移动段晓东2023.6 算力网络的发展回顾 中国移动充分发把握算力时代发展脉络,以网强算提出“算力网络”全新理念,一年多来持续开拓创新,全力推进算力网络发展,在业界取得了广泛共识,引起了巨大反响 算力网络是以算为中心、网为根基,网、云、数、智、安、边、端、链 (ABCDNETS)等深度融合、提供一体化服务的新型信息基础设施。 ——中国移动《算力网络白皮书》 提出新概念 杨杰董事长提出“算力网络”概念与愿景 发布新理念 发布中国移动《算力网络白皮书》和发展倡议 融入新战略 成为“5G+算力网络+能力中台”新型信息基础设施的关键一环 开创新方向 发布《算力网络技术白皮书》,提出十大技术方向 开启新征程 发布《算力网络创新成果》;CFITI试验网与中国算力网、信息高铁三方互联,打造科学装置 迈向新阶段 成立算力网络子链,组建14支攻关战队 2023.3 2022.6 2022.12 2021.8 2021.11 2022.1 算力网络发展路径 算力网络的发展过程既有固网强基、从云向算的继往开来,也有技术创新的科学高峰,是工程+技术的有机结合 起步阶段:泛在协同发展阶段:融合统一跨越阶段:一体内生 运营服务编排管理基础设施 一站服务:一站开通算网服务协同运营:云网运营双入口拉通 协同编排网随算动 融合服务:产品融合、确定性服务统一运营:统一入口、统一平台 智能编排算网融合 一体服务:多层次智简无感服务模式创新:多方算力可信交易 智慧内生算网一体 2021-2023 十四五阶段 2024-2025 2025~ 十五五阶段及更长期 推动算力网络体系化发展 中国移动从算网基础设施构建、业务融合创新、创新技术引领等多方面系统化推进算力网络建设和发展 主线一 面向算网基础设施构建 物理空间、逻辑空间、异构空间、多主体算力融通 “4+N+31+X”布局,1000+边缘节点打造20ms、5ms、1ms三级时延圈SRv6/G-SRv6打造统一算网底座 主线二 面向业务融合创新 实现算网高效协同,支持CHBN业务融合发展,打造算网全新生态 产品算力化和算力产品化发布算网服务1.0 构筑算网大脑 主线三 面向创新技术引领 实现创新技术引领,打造原创技术策源地 三横两纵体系架构提出十大技术发展方向三十二个核心技术体系 高广深推动算力网络走深向实 算力网络的发展是一个既往开来的重大工程,要持续提升发展的高度、广度和深度 提升高度拓展广度挖掘深度 打造新型智算中心 创新广域算网服务能力 推动算网一体发展 新型智算为重点,构筑“通智超”多维、云边端多级、社会多元的泛在化算力 面向移动网广域、移动性的特征,提供泛在移动接入、端网协同、体验可保障的算网融合服务 推动算网等技术要素从孤立向融合一体化发展 新型智算 高 “移动+算力网络广 ” 算网一体 深 方向七:可信共享的算网服务 算力交易数据流通 运营服务层 OTN灵活光电联动 400G/800G 全光高速互联 算网SPN切片承载 PON超宽全光接入 方向三: 光电联动全光网络 智能网络调度 方向一: 泛在智能新型算力 方向六:融数注智的算网大脑 多要素融合编排算网智能化 编排管理层 算网数据感知 泛在调度 算网原生编排 算网基础设施 层 方向二: 多样性计算架构 算力原生 云原生 方向五:算网深度融合 算力路由 算力卸载 算力度量 存算一体 智能算力 在网计算 方向十: 空天地一体星云算网 空天地一体 方向四:确定性IP网络 应用感知 全调度以太新一代 SD-WAN SRv6/G-SRv6 绿色 方向八:端到端绿色低碳 芯片节能 服务器节能 数据中心节能 低碳能源 安全 方向九:能力内生新安全 全程可信 安全编排 隐私计算 算网业实时调度 广域RDMA 存算一体 算网QOS保障 在网计算 全调度以太 广域算网移动会话管理 算力路由 算力原生 算力网络重要技术方向 攻关新型智算、“移动+算力网络”、算网一体三大重要技术方向,打造技术策源高地 一、打造新型智算中心,发展算力新高峰 智能算力将成为未来算力主流,中国移动加快发展智能算力, 以新型智算中心为发力点,打造算力高峰,推动算力网络实现智能跃迁 锚定新型智算新特征,持续构建新型智算中心技术体系和创新突破 九天AI应用使能 新型智算中心NICC 效:高效节能控制 “芯合”算力原生 跨架构编译器 算力抽象运行时 裸金属实例 异构算力池化 虚拟机实例 容器实例 智算框架 TesnsorFlow PyTorch PaddlePaddleDeepspeed ... 智算原生 ROCm CUDA CANN ... 管 智算设施 GPU集群算力 存 多元融合存储 网 CPUGPU文件对象 块 高速无损网络 高性能 全以太 RoCE 智算基建 液冷 整机柜 高效供电 冷却水系统 智算运营 编排调度计量计费算力交易 能力开放 FCAPS日志 管理管理 资产管理 算力管理 存储管理 网络管理 管 (NewIntelligentComputingCenter) 以GPU、AI加速卡等智能集群算力为核心集约化建设的E级超大规模新型算力基础设施,软硬件全栈环境,支撑AI大模型的高效训练, 支撑行业数智化转型升级 :异构算力池化 网:高速无损网络存:多元融合存储 算:GPU集群算力 新型智算中心 传统云数据中心 NICC新型智算中心技术体系 面向新型智算提出算力原生、全调度以太原创技术 中国移动原创提出算力原生技术,打破“框架+工具链+硬件”紧耦合生态 构建“芯合”算力原生跨架构平台,实现应用跨架构无感迁移,打造以软件为核心的智算 全调度以太网突破智算中心网络性能瓶颈,打造无阻塞、高带宽及超低时延的新型 产业链牵引模式,繁荣智算产业全“芯”生态 应用层 智慧政务 智慧医疗智慧交通智慧能源 应用层 智慧政务 智慧医疗智慧交通智慧能源 M次开发 框架层 Pytorch 1次开发 ……. 框架层 Pytorch ……. 算力原生 芯合算力原生跨架构平台 N类适配 1体适配 硬件层 硬件层 繁冗开发、复杂适配、各自为栈 一次开发、一次封装、跨芯迁移 NeuWare ROCm CANN NeuWare ROCm CANN oneAPI oneAPI CUDA CUDA 分发粒度 从“流”分发到“容器”分发 •基于虚拟容器的逻辑转发单元 •逐“容器”的动态负载均衡机制 智算中心网络,构建标准开放技术体系,助力产业发展 与传统以太网相比,全调度以太网主要有分发粒度、发流模式及管控模式三大机制变化,实现高 效、精确和可靠的网络 发流模式 从“推”流到“拉”流 •VOQ调度,最大限度避免拥塞 •精细反压机制,避免HOL等问题 管控机制 从分布式管控到集中式管理 •集中式全局网络信息维护及调度 •分布式管理面、控制面及数据面 •发布业内首部《面向智算的算力原生白皮书》,提出“两层架构”和“三大核心技术” •在ITU、CCSA完成首个算力原生标准立项,牵头在OIF成立首个算力原生子工作组 •打造“芯合”算力原生平台,验证算力原生技术理念 发布业界首个《全调度以太网技术架构白皮书》,展开芯片、协议、设备、管控及架构等关键技术攻关 二、面向泛在接入和移动性支持,构建“移动+算力网络”技术体系 移动通信网络从云化走向算网融合。“移动+算力网络”基于移动网络架构与算力资源,组成开放式服务化算网基础设施,是算力网络在移动接入场景下的具象化体现 5G-A6G 算网融合的新型信息基础设施 算网任务资源映射 算力任务汇总 算网业务编排管理层 算网资源统一编排 MCFN节点 MCFN节点 MCFN节点 终端算力 MCFN节点2 UE 移动承载网 骨干网 算网融合资源层 基站算力 Mesh互联 边缘算力 移动算力网络应用服务层 统一租户模型 算力原子能力开放 终端算力卸载 移动算网能力开放 算网融合控制调度层 移动算力需求识别任务分解 算网融合路由控制 算网路径规划 算网QoS 算网移动性调整 算网融合感知 算网任务分解 算网需求识别 移动算力网络节点控制功能 移动算力节点建模 算力节点ID管理算力节点注册管理 5G核心网全面云化、无线尝试云化 4G 核心网引入虚拟化,软硬件解耦 V2X消息 路侧通信单元 V2X消息 B 超车? A 移动网络辅助下的算力协同使能车联网 中间数据 高动态长时目标跟踪 滑雪运动员 推理结果反馈 5GS UPF AI推理服务 UPF 高品质连接 UPF移动算力网络节点1 AI推理服务UPF 移动算力网络 移动算力网络节点2 网络路径优化 移动终端算力上移,降低终端AI硬件要求 算网协同层 UPF UPF UPF UPF 边缘智能 (图像识别及定位) 云控平台 移动通信系统架构演进中,资源逐步实现平台化,从云化走向算网融合 移动算力网络主要应用于广域泛在移动、路径灵活调度、端网协同分担等典型场景 设计移动算力网络逻辑架构,实现算力资源的统一控制、调度、管理和开放 6G网络架构设计内生支持计算要素,定义全新计算面 中国移动提出业界首个系统性的“三体四层五面”6G网络总体架构,引入“算力”资源要素形成通信与算力层,定义基于服务化设计的全新计算面 网络本体 提出业界首个系统性的6G网络总体架构,在架构层面内生支持计算要素,实现算网深度融合和算力服务供给 三体 体 管理编排 数字孪生体 开放使能层 通信与算力层 连接与路由层 服务化功能层 用户面 数据面 计算面 控制面 安全面 服务化功能层 计算面 计算任务编排 控制面+用户面+计算会话、策略管理计算资源管理 数据面 安全面 计算任务执行 增加独立孪生体,虚实映射重组管理编排体,智能自治 四层 功能分层,跨域拉通强化算力、路由 五面 在服务化功能层中定义全新计算面,以任务为中心进行计算任务的编排,基于服务化设计提供计算即服务,实现算网一体内生设计目标 增强传统控制面/用户面 增加独立数据、计算和安全面 三、创新提出“算网一体”策源方向,推动计算与网络两大学科交叉融合发展 构建算网一体技术体系,布局算力路由、在网计算、广域RDMA等算网一体前沿原创技术标准化历时4年推动IETF成立算力路由工作组CATS,中国移动担任主席 联合感知 网络状态 算力负载 前提 从单技术域向算网双域相互感知信息 融合选路 调度成本、系统能效资源利用率... 从单一目标选路向多目标综合求解优化 算力路由 突破互联网架构协议,距离向量叠加算力向量,整体优化算网资源 算力路由的提出 算力路由组网架构 2023年3月CATSWG成立 暨首次会议,是路由域最受欢迎的工作组之一 QPSK新调制 极致互联 新型拥塞控制 数据加密 从尽力而为向低时延无损、高通量可靠演进 支撑作用 突破广域传输性能瓶颈,实现RDMA高效传输拉远 ③解决思路 在路由中引入计算信息,进行联合调度 ②问题本质 计算和网络是独立系统 算的负载和网的拥塞信息没有产生关联 ①发现问题 云边以及边边调度之间出现“性能反转” 广域RDMA 在网计算打破算网边界,网络内生算力, 计算任务跨网络节点分布式协同 成立两大算力网络发展基础支撑平台 构建多节点互联、双平面互促的算力网络试验示范网(CFITI),并与“中国算力网”、“信息高铁”等互联,面向基础学科和前沿技术创新形成技术支撑平台。 成立算力网络子链,以“补强建延”为指导思想,构建产业支撑平台,成立14支攻关战队开展协同攻关,提升产业链韧性和竞争力,推动算力网络产业繁荣发展 四维一体、链式牵引 编队作战,协同创新 补链 建链 四大工作组 算力基础设施 网络基础设施 算网服务和协同 算网应用 强链 延链 揭榜攻关 专专协同 五大协同创新机制 “1+9+9” 节点布局 “A-B”双