从IPv6+到算力路由,开创算网一体新发展 中国移动研究院段晓东2023/12/12 通信网络正加速向新型信息通信网络演变 通信网络新型信息通信网络 网络为核心的信息交换 提供语音、短信、移动宽带等通信服务 算力为核心的信息数据处理 提供计算、感知、智能、安全等一体化的新一代信息通信服务 架构范式 技术范式 资源范式 产业范式 2 中国移动算力网络发展历程 中国移动深刻把握算力时代发展脉搏,发挥运营商网络领先优势,以网强算提出“算力网络”全新理念。两年来,继往开来、开拓创新,全力推进算力网络发展 算力网络是以算为中心、网为根基,网、云、数、智、安、边、端、链 (ABCDNETS)等深度融合、提供一体化服务的新型信息基础设施。 提出新概念 杨杰董事长提出“算力网络”概念与愿景 发布新理念 发布中国移动《算力网络白皮书》和发展倡议 融入新战略 成为“5G+算力网络 +能力中台”新型信息基础设施的关键一环 开创新方向 发布《算力网络技术白皮书》,提出十大技术方向 打造新平台 启动算力网络试验网CFITI1.0,发 布算网服务体系1.0 构建新装置 发布《算力网络科技创新成果》,CFITI试验网与中国算力网、中科院信息高铁联合打造科学装置 组建新战队 算力网络子链组建14支攻关战队联合攻关产业问题 5G ——中国移动《算力网络白皮书》 算力智慧 网络中台 3 IP技术创新进入算网融合发展新阶段 网一体的算力网络新阶段 互联网历经IPv4/MPLS、IPv6/SRv6(G-SRv6)发展阶段,网络能力从尽力而为向低时延、高可靠、确定性提升;数字经济的发展推动网络从连接算力向感知、调度算力演进,逐步进入算 三阶段:算网融合/算网一体 二阶段:IPv6/SRv6(G-SRv6) 一阶段:IPv4/MPLS 尽力而为带宽共享质量保障综合承载 海量地址低时延万物互联高可靠 算为中心网为根基算网融合算网一体 4 借助IPv6技术创新,推动IPv6发展走向纵深,实现IPv6从研究实验到规模商用的跨越 网络基础设施 核心网、承载网及全部网管、安全、DNS系统100%支持IPv6 应用基础设施 全部IDC、746个CDN节点、200+个移动云产品、 31个云资源池100%支持IPv6 互联互通 23个骨干直联点100%支持国内互通带宽29.4T 国际互通带宽4.6T 用户流量 全网IPv6活跃连接数9.8亿 移动网络IPv6流量占比60.2%固定网络IPv6流量占比20.4% 数据统计截至2023年11月 借助移动网络换代机遇突破IPv6发展瓶颈,推动实现移动网络与IPv6同步发展,建成全球最大规模IPv6网络以“LTE、VoLTE和应用”三大抓手,突破移动互联网IPv6用户发展和流量牵引难题,移动网IPv6流量占比达60%5 2借助以G-SRv6为核心的IPv6+体系构建,进入初步原创阶段 产业数字化和数字产业化升级推动网络持续迭代,中国移动从基础协议创新、业务应用创新出发,全面构建IPv6+创新技术体系,助力网络实现从带宽要素向确定性保障多维要素升级演进 智享 WAN G-SRv6业务应用创新 应用感知 网络切片 业务链 重路由 及保护 基础 OAM 随流 检测 流量 调优 G-SRv6基础协议创新 G-SRv6帧格式、转发机制和控制协议 6 围绕G-SRv6构筑国际标准体系,助力我公司在IETF贡献度跃居全球运营商首位、全球公司前列 2.1原创提出G-SRv6技术,引领国际标准发展 原创提出G-SRv6基础帧格式和转发机制,在支持现有SRv6所有特性前提下,彻底解决SRv6开销问题,成为 IETFSRv6基础标准,是我国在IP领域少有的基础协议突破 四大原创技术已申请专利,成功写入IETF国际标准 ① ② G-SID Container G-SID Container G-SID 7 Container IPv6头部 二维指针定位 扩展SI与原有SL结合形成二级索引,解决压缩SID定位难题,降低转发硬件实现复杂度 压缩冗余前缀 利用IPv6地址格式规律,压缩后的G-SID仅含差异部分,解决SRv6报文封装效率低问题 ③ 统一容器 压缩SID和原生SID使用统一128位G-SID容器承载,解决异构SID兼容难题 压缩标记 识别SID列表中下一个SID是否压缩,解决SID转发编排联动问题 SRH头部 带动中国移动在IETF标准组织贡献度跃居全球运营商首位 7 SIDListSL③ ④SI Payload 智享WAN是基于G-SRv6的新一代SD-WAN,围绕应用+安全+网络+算力布局多项创新技术,在BBF主导国际标 准立项,自主研发业界首个智享WAN产品,提供连接+算力一体服务 2.2打造智享WAN算网服务平台,成为SD-WAN新方向 智享WAN统一控制器 应用感知 网PE/PoP 云PE/PoP G-SRv6 CPE 接入网 G-SRv6云专网 云 G-SRv6Overlay接入网PE/PoP云PE/PoP 端到端G-SRv6+业务可视、可保障 避繁就简:基于G-SRv6技术,整合Overlay和Underlay网络基础资源,提供算网服务 域名应用绑定SLA路径CPE灵活弹性调整策略使能应用级精细化运营 源路由VPN授权访问源地址路由过滤识别量子随机数增强加密 Overlay/Underlay资源整合大网网络能力最优利用源地址推导穿越防火墙 智能融合SRv6业务链安全、加速等增值服务拉通云内+云间新算网 8 3.2构建完整产业链,实现全球范围大规模部署 G-SRv6完成从概念到技术成熟的全进程创新,成为全球化规模部署的新一代IP网络基础协议, 跻身互联网基础协议族 构建G-SRv6百亿级产业链,关键技术纳入芯片内核 实现了国家级骨干网路由器核心芯片自主掌控,形成包括国内外芯片、设备、控制器、测试仪表在内的国内外10余厂家全面支持的全球产业生态 建成全球最大规模的G-SRv6网络,成为全球主流网络部署技术 在中国移动云专网、欧洲Orange、南非MTN、沙特STC等海内外运营商规模部署,全球多家运营商正计划引入 测试仪 芯片 控制器 设备 欧洲Orange 伊拉克Asiacell 沙特STC 印尼Indosat 南非MTN 9 3.1算力与网络跨学科交叉融合创新,走向一体共生 算为核心,网为根基,算力与网络的融合体现在“以算促网”和“以网强算”两个方面,二者“双向驱动”,算网交叉融合创新成为发展新范式 网络演进需求算力发展需求 从通信服务向新型信息通信服务转变 性能代际提升对算力提出更高要求 单一速率范式制约网络规模发展 摩尔定律下单点算力面临性能瓶颈 多样性算力需要异构融通、互补协同 泛在算力闲散分布,需要高效集约利用 网络 算力 研判:算和网已经呈现双向驱动趋势,为了进一步呈现整体的能效、性能和利用率优势,需要算网一体化的系统思维和多学科交叉创新 算网一体=F(Computing,Network) 必要条件:Network,Nomputing互相影响 充分条件:F(Computing,Network)>=F(Computing)+F(Network) 限制条件:有限的Computing资源,和有限的Network资源 优化目标:=G(能效、性能、利用率) 能效 利用率性能 3.2算网一体主要特征 算网一体原创技术深度赋能算网基础设施、编排管理、运营服务多层次一体化发展 设备一体 协议一体架构一体 服务一体 以外挂或内嵌/内生的方式,形成“算力感知”、“网络感知”或“转发即计算”的计算形态,构建异构融合的设备硬件 支持算力、网络、应用等多维资源感知和调度的新协议,可通过网络协议扩展并携带计算信息,或者定义新型协议 构建统一编程范式和异构算力抽象机制,形成一体编译链接、跨架构动态运行的基础软件架构,实现应用跨架构无感迁移 网络和计算服务统一入口,通过能力的相互补充和调用,面向用户提供无感知的网络和计算服务 3.3构筑算力网络发展源动力,开创算网一体原创技术体系 算力网络是算网交叉学科创新的重大契机。为构筑算力网络发展源动力,开创算网一体原创技术体系,已形成一批标志性的原创技术 总线互联 卡间高速通信 算力路由 突破互联网架构协议 数据快递 突破广域传输性能瓶颈 全调度以太 突破无损以太性能瓶颈 新一代SD-WAN Under与Overlay协同 算力并网 实现算力供给侧改革 算力智能内生 计算要素创智能服务 移动算力 5G、6G新增计算面 算力原生 实现应用跨架构迁移 存算一体 突破冯氏架构 算力度量 打破单维算力指标 在网计算 打破算网边界 隐私计算 安全数据分析计算 算力卸载 多算力形态统一底座 400G/800G 超高速大容量全光网络 G-SRv6 统一IP承载协议 空芯光纤 新型光纤介质与系统 算力解构 应用模块化解构部署 50GPON+FTTR 新型接入网架构 云原生 敏捷高效体系 OTN光电联动 新型全光网架构 全光接入 新型接入网架构 应用感知 应用类型识别 空天地一体 突破异构算网融合 原创技术“5颗珍珠”:算力原生、全调度以太、算力路由、在网计算、数据快递 3.3.1算力路由:引领国际标准化突破 算力路由将算力因子引入路由域,实现网络和计算的联合优化,满足新型业务需求及算网资源的全局优化 典型场景:Computing-AwareAR/VR AR/VR时延需要低于20ms保障用户体验,包括: •传感器采样延迟:<1.5ms(客户端) •显示刷新延迟:≈7.9ms(客户端) •GPU的帧渲染计算延迟≈5.5ms(服务器) •网络延迟(预算)=20-1.5-7.9-5.5=5.1ms(网络) •观察1:计算延迟和网络时延在同量级 •观察2:仅根据网络或计算负载,总延迟无法满足 •观察3:根据两者选择边缘站点3,总延迟≈19.4ms 结论:流量调度时需要同时考虑网络和计算资源状态 技术路径分析 1.当前缺乏将计算资源与网络状态相结合的方案。 2.现有的解决方案通常为off-path,如DNS、ALTO或L4/L7负载均衡,查询地址/状态的时延随着协议层的升高而升高! UpperL7 Scheduler 数据库查询 L7Scheduler 重定向 L4Scheduler L3CATS 随路调度 结论:算力路由将具备更高的性能 历经4年,中国移动在IETF发起成立算力路由工作组(CATS,Computing-AwareTrafficSteering),中国移动担任主席,是IETF路由域近10年由中国高校/公司牵头成立的两个工作组之一 CATS工作组会议CATS预计将产生系列创新协议 CA-BGP CA-BGP-LS CA-OSPF CA-Netconf/yang CA-Restful/json 13 3.3.2全调度以太:高性能新以太互联网络 大模型以分布式训练为基础,通信开销导致GPU集群有效算力难以线性提升,网络成为AI算力“瓶颈”,亟需构建以 新型以太网技术为基础,开放兼容、超高性能的新型智算中心网络技术体系 中国移动联合产业提出全调度以太网(GSE)技术架构,创新以太网转发机制,实现三大核心机制转变 从“流”分发到“报文”分发 从盲发+被动控制到感知+主动控制 从“局部”决策到“全局”调度 将业务流拆分到不同“报文容器”转发,提供逐“报文容器”负载均衡机制,提升带宽利用率 从被动拥塞控制,到基于“授权请求和响应机制”的主动流控,最大限度避免网络拥塞产生 全局视野的转发调度机制,实现集中式管理运维、分布式控制转发,提高网络可用性 1 32 321 Leaf 321 321 321 Spine 321 拥塞 Spine Leaf 321 321 21 丢