面向算网一体算力路由技术攻关与标准突破 中国移动通信有限公司研究院 “算网一体”是中国移动算力网络发展的深化 起步阶段:泛在协同发展阶段:融合统一跨越阶段:一体内生 运营服务 一站服务:一站开通算网服务 协同运营:云网运营双入口拉通 融合服务:产品融合、确定性服务 统一运营:统一入口、统一平台 一体服务:多层次智简无感服务 模式创新:多方算力可信交易 编排管理 协同编排 智能编排智慧内生 基础设施 2021-2023 网随算动 十四五阶段 算网融合 2024-20252025```` 算网一体 十五五阶段及更长期 2 算网一体总体设计 联合感知 混合控制 网络信息 拓扑信息 拥塞状态 SLA指标 算力信息 CPU利用率 异构算力 算力规模 前提 集中式控制 分布式控制 节点1 节点2 节点4 消费侧 任务分解与 调配 节点3 极致互联 ISP1 ISP2 •ISP:网络服务提供者; CSP:算力服务提供者 CSP4 CSP3 CSP2 CSP1 支撑 作用 联合感知 混合控制 极致互联 网络和计算相互感知,是算网一体化发展的基础和前提进行网络和计算一体化的控制和调配,保障端到端 服务质量,优化资源利用率 网络连接和算力分布更加泛在,提供一体化算网基础设施服务 网络服务提供者和算力服务提供者的高效联动,提供一体化的算网应用服务 算力路由通过联合感知实现混合控制 通过仿真发现在路由中引入算力信息在低、中、重载情况下均有一定的优化效果 批量100个客户端通过http连续访问服务端程序 2018年开始研究算网融合技术,面向云边协同和边边协同的“性能反转”等问题,提出在路由域引入计算信息进行联合调度 发现问题 问题本质 解决思路 云边以及边边调度之间出现“性能反转”计算和网络是独立系统,算的负载和网的拥塞信息没有产生关联 在路由中引入计算信息,进行联合调度, 中心云计算负载高及网络队列深的条件下,边缘响应 边缘节点平均时延及尾时延远大于中心云 算:降低负载、计算资源预留... 问题:造成大量计算资源的闲置 网:增加带宽、配置专线... (1)感知:路由系统感知计算资源 (2)路由:综合网络和计算信息寻 址选路形成算力感知网络CAN的核心 边缘节点 算的负载状态以及网的拥塞情况均是问题来源 问题:增加网络建设、运维成本 方向算力路由 算力路由协议簇设计 算力路由协议簇 算力路由组网示意图 算力路由协议簇包括IP路由协议、管理面协议等,实现算力感知、路由调度以及配置管理 ①CA-BGP: 采集到的算力信息,通过扩展BGP协议path属性,将算力信息在网络中传递,方便路由选路 ②CA-BGP-LS: 算力路由出口节点向算力节点收集算力状态信息,直接通告控制器 ③CA-OSPF: 通过扩展OSPF协议,将采集到的算力信息,在域内泛洪,为域内选路提供算力参考 ④CA-Netconf/yang: Yang模型中添加算力信息,通过Netconf协议下发配 置 ⑤CA-Restful/json: Json消息中增加算力信息,通过restful协议接口收集算力信息 算力路由国际标准化突破 历经4年,中国移动在IETF发起成立算力路由工作组(CATSWG)并担任主席,是IETF路由域近10年由中国高校/公司牵头成立的两个工作组之一 CATS面向AR/VR、车联网等新型多节点部署服务的场景,制定算力路由的场景、需求、架构标准 里程碑/计划 IngressCATS-Router •流量分类器(CATS-TC)路径选择器(CATS-PS) 主要参与方 工作组范畴和计划 •2023年7月,场景和需求文稿立项(已完成) •2024年7月,架构文稿立项 •2025年11月,发布架构标准RFC CATS架构核心组件 EgressCATS-Router •网络指标代理(CATS-NMA)服务指标代理(CATS-SMA) CATS-controlcenter •计算信息表(CATS-CIB)网络信息表(CATS-NIB) •路径计算单元(CATS-PCE)计算感知接口(CATS-SBI) 算力路由实践进展 4 算力路由系统实现根据网络部署情况,支持集中式、分布式、混合式等多种组网方案。从集中式方案开始,分阶段逐步开展算力路由实验验证 算网控制器 Restful 算网一体感知协议3CA-BGP-LS BGP-LS Telemetry BGPSRv6PolicyBGP-FS Netconf 云管理平台 CA- 算力路BGP 2 CA- CA-1应用APP BGP云资源池 算力路由网关 由网关 5BGP CA- 应用APP 云资源池 算力路由网关 BGP 算力路由 网关 算力路由网关 1 2 阶段I集中式方案 •完成算网控制器和算力路由网关原型样机开发, 构建业内首个集中式算力路由验证系统 •推进广东珠海现网试点验证,验证业务承载量提升30%以上,算网综合资源利用率提升32%以上 算网控制器 算力路由网关 阶段II端到端分布式算力路由系统验证 •开展规模性部署的CATS技术方案验证 •开展CA-BGP等新型协议的验证测试 •分布式算力路由样机已进入平台测试阶 段 分布式算力路由样机 《算网一体技术体系关键技术创新案例》荣获CCSATC6102022年度“最佳实践案例” 《算力感知和算力路由构建算网一体化调度》荣获工信部2022年ICT优秀案例“卓越科技创新奖” 《算力感知和路由方案》荣获通信世界全媒体“2023年度算力应用案例十大标杆” 总体测试方案 分布式算力感知分布式网络感知 3 4 5 集中式算网一体感知集中式多策略调度算力路由转发 分布式:125 集中式:345 用户 面向算网一体算力路由技术攻关与标准突破 中国移动通信有限公司研究院 中国移动研究院公众号中移智库公众号