算网大脑助力算网服务创新发展 中国移动研究院赵鹏 目录 背景算网大脑 关键技术 算网大脑产品和实践 算力网络发展背景和关键驱动力 算力网络是国家战略的要求,产业发展的趋势和公司转型的动力,为全社会数智化转型和公司发展定位转型带来全新机遇。 国家战略要求算力网络 发改委 数据中心纳入“新基建” 《十四五规划》 加快数据中心体系建设 四部委 启动“东数西算”工程 工信部 提出“三年行动计划” 产业发展呼唤算力网络 国家 战略公司转型需要算力网络 •产业创新:产业数字化转型加速,对融合信息基础设施的供给提出更高需求 •技术融合:DICT技术持续融合,相互促进,产业 共同发展发展 •绿色低碳:碳达峰、碳中和,建设新型低排 放基础设施 •业务创新:提升网络价值,开创算网全新业务场景 公司•角色转型:重构运营商的服务体系,从 转型网络管道提供商向算网服务提供商转型 •技术突破:打造原创技术策源地,成为创新链技术突破的重要根基 算力网络(ComputingForceNetwork)的定义 算力网络是以算为中心、网为根基,网、云、数、智、安、边、端、链(ABCDNETS)深度融合的新型信息基础设施,实现“算力泛在、算网共生、智能编排、一体服务”的目标,推动算力成为与水电一样,可“一点接入、即取即用”的社会级服务,达成“算力无处不在、网络无所不达、智能无所不及”的愿景。 一体服务:实现三个融合供给 ①多要素融合供给:融合算网数智链安等多要素 运营服务层 Ⓒ社会算力融合供给:算力并网、可信交易 编排管理层 智能编排:融数注智,构建算网大脑 ③数智服务融合供给:随需满足、体验“无感”、使用智简 ①一体编排:实现算网统一编排/调度/管理/运维 Ⓒ核心能力构建:打造算网资源一体设计、全局编排、灵活调度、 高效优化的核心能力 分布式算力(边) 分布式算力(端) OTN/OXC 基础设施层 分布式算力(中心)分布式算力(中心) 统一IP算网底座 分布式算力(网) OTN/OXC 全光底座 分布式算力(边) 分布式算力(端) 分布式算力(网) OTN/OXC 算力泛在:实现三融通,构建云边端多层次、立体分布式算力 ①空间:融通东西,4+3+X数据中心布局 Ⓒ逻辑:融通云(C)、边(E)、端(T) ③内核:融通异构,实现ARM/x86/GPU/FPGA等多样性算力 算网大脑是实现算力网络愿景的关键系统 平台层:统一编排管理、算网自智 向下:进行统一调度 算网大脑通过对算力和网络资源的统一编排调度和管理运维,融数注智,向下实现泛在算力的跨层跨区域融通和网的跨域跨专业拉通,向上实现多要素融合能力供给和算网一体化服务支撑,是算力网络的关键系统。 运营服务层 一体化运营运维能力 “算网大脑” 算网统一编排 算网智能化 编排管理层 一体化算网编排能力 算网基础设施层 向上:提供一体化运营运维能力 算网大脑整体定位 继往开来,即将迈入算力网络新阶段 走过算力网络“泛在协同”的重要阶段,即将迈入“融合统一”的发展新阶段 起步阶段:泛在协同发展阶段:融合统一 跨越阶段:一体内生 运营服务 编排管理基础设施 一站服务:一站开通算网服务协同运营:云网运营双入口拉通 协同编排网随算动 融合服务:产品融合、确定性服务统一运营:统一入口、统一平台 智能编排算网融合 一体服务:多层次智简无感服务模式创新:多方算力可信交易 智慧内生算网一体 2025~ 十五五阶段及更长期 十四五阶段 2021-20232024-2025 中国移动算力网络发展历程 中国移动深刻把握算力时代发展脉搏,以网强算提出“算力网络”全新理念。两年来,继往开来、开拓创新,全力推进算力网络发展。 算力网络是以算为中心 、网为根基,网、云、数、智、安、边、端、链(ABCDNETS)等深度融合、提供一体化服务的新型信息基础设施。 提出新概念 杨杰董事长提出“算力网络”概念与愿景 发布新理念 发布《算力网络白皮书》和算网运营管理系列行业标准 融入新战略 成为“5G+算力网络+能力中台”新型信息基础设施的关键一环 5G 打造新平台 启动算力网络试验网CFITI1.0,发布算网服务体系1.0 开创新方向 发布《算网大脑白皮书》、提出算网大脑 愿景、发展路径等 构建新装置 发布《算力网络科技创新成果》 ,CFITI试验网与中国算力网、中科院信息高铁联合打造科学装置 组建新战队 发布《算力网络科技创新成果》,CFITI试验网与中国算力网、中科院信息高铁联合打造科学装置 ——中国移动《算力网络白皮书》 算力智慧 网络中台 目录 背景算网大脑 关键技术 算网大脑产品和实践 算力的含义 算力用于表征单位时间进行某种计算处理的能力 •狭义上,算力是设备系统的计算处理能力,包括芯片、单机、超算集群几个层面,按照所处理计算的类型区分为TOPS、FLOP/S、Hash/S等单位进行度量; 广义:系统整体处理数据的能力 释放算力需要算力、网络、存储的有机协同 •广义上,算力是系统整体处理数据的能力,在单机设备计算能力基础之上,整体系统算力的释放还取决于算力与系统内网络、存储等资源的高效协同 狭义:设备的计算能力/处理数据的能力 逻辑:TOPS;AI:FLOP/S;比特币:Hash/S 网络迟滞拖累整体性能 网络过快等待时长增加 算网大脑是算力网络的中枢调度决策系统 •算力从狭义到广义有芯片、单机、集群和网络化算力等多种不同形态。 •网络化算力需要与之匹配的中枢调度决策系统--算网大脑,算网大脑的本质是算力网络操作系统,其最重要目标是实现算力网络算力供给能力、数据处理能力、网络连通能力、业务供给能力的最大化。 计算任务 控制单元CU 软件应用 云服务 算网一体化业务 操作系统 K8S、OpenStack… 算网大脑 单芯片算力 整机算力 云化算力 网络化算力 基于OODA决策循环模型的算网大脑关键能力设计 基于OODA决策循环模型,其核心是观察、导向、决策、行动四个阶段; 算网大脑是算力网络的中枢调度决策系统,其核心能力是算网态势感知、智能分析、编排和调度执行。 OODA循环模型 美国战略理论家约翰·博伊德为空军作战提出OODA循环模型,相比与PDCA,是一种更加适用于高度复杂、动态变化场景的决策思路。 算网大脑关键能力设计 算网大脑感知算力网络基础设施信息,基于业务需求综合分析制定算网业务方案,通过算网多要素的最优分配,实现算力的最大效力发挥。 Observe 通过各种设备和网络收集信息 感知 算网资源及数据采集和管理 Act 执行操作 OODALoop Decide 明确制定方案,下达操作命令 Orient 分析判断,结合经验,将数据转化为有用的信息 调度执行完成实际资源分配及网络配置 编排 算网业务一体化业务设计和编排全生命周期管理 智能化 算网业务智能感知、编排及调优 算网大脑带来的变化 算网大脑在“全局”、“动态”、“智能”三方面发挥核心作用,依托底层各专业域能力的标准化供给,实现在场景定制、多要素融合和智能保障等方面的业务体验全面提升。 全局:算力融通和多要素融合 •算力:物理(空间)、逻辑(云边端)、异构(智算、通算)、多主体(三方云算力)四融通 •多要素:实现“ABCDNETS”多要素算力 +网络+能力的融合一体供给 动态:持续的最优方案交付 •业务一体交付:结合实时感知的算网多方因素和策略,实现需求和资源的最优匹配和最优方案交付 •业务运行期间:持续对业务和资源状态进行 感知并针对业务的质差和劣化进行动态优化和调整 智能:全周期的算网自智 •意图驱动:用户任务式意图的智能识别和需求拆解 •业务体验保障:业务运行期间持续的智 能分析决策,以及智能化的业务体验优化保障 •服务模式创新:智能技术的深度融合推 动催生新的服务模式 支撑算力网络业务场景可灵活定制、多要素可融合供给、体验可动态智能保障的全面提升 关键技术能力1:全局—跨域多要素联合编排 随着业务场景的复杂化和技术的融合发展,智能视频、车联网等涵盖算力、网络、AI智能、终端等多种能力要素的场景加速发展,需要算网大脑实现“ABCDNETS”多要素的纳管、设计、调度、优化等联合编排能力。 跨域多要素的算网业务场景 算网产品能力:如智能视频 云间互联多要素协同 AI算法 视频云 入云连接 云专网 人脸识别 摔倒识别 抽烟识别 接入 存储抽帧 最低时延 最高可用最低成本综合平衡 云主机 对象存储 视频/网页/下载加速 云专线 云组网 彩信 视频抽帧 视频转码 违停识别 烟雾识别 堡垒机 防攻击 文件存储 AI训练算力 CDN内容管理能力 摄像机 物联网 短信 呼叫 视频存储 图片抓拍 人脸识别 抽烟识别 防火墙 流量清洗 接 音门入 箱禁认证 渲染算力 AI推理算力 CDN用户日志查询能力 CMNET PON 短信彩信IVR平台平台平台 CPU GPU CPU 人脸识别算法抽烟识别算法 防火墙镜像 流量清洗镜像 CPU 接入 存储 抽帧 摄像智能智能溯源身份可信机音箱门禁服务服务存证 SPN 云专网 FPGA 存储 存储 违停识别 烟雾识别 堡垒机镜像 防攻击镜像 存储 转码 监控 分发 核心网 物联网 DPU 内存 内存 火情识别 抗Ddos攻击 安全资源池 内存 网络能力管理 短彩 多算管理 CDN 视频大数据 AI 安全 MEC 终端管理 区块链 重点攻关技术方向 跨域能力集中纳管 多要素融合方案设计 网(N) 云(C) 数(D) 智(A) 安(S) 边(E ) 端(T ) 链(B ) 跨域调度 联合优化 关键技术能力2:动态—持续的最优方案交付 算网大脑在算网业务需求和基础设施约束之间实现的最优供需匹配 需要针对不同的算网业务和SLA需求,综合算力、存储、成本等成本因素,和带宽、时延、可靠性等网络因素,以及能耗、资费、安全等环境因素,实现多要素能力的融合供给、客户需求的最优匹配和持续动态调度 算网大脑支撑全局最优的业务开通 (以云电脑业务为例) 云电脑应用边缘云A 线路2云专网中心云A 线路3 客户终端 线路1 边缘云B 云电脑应用 云电脑应用 以云电脑业务为例,算网大脑根据客户需求以及运营商自身策略通过简单算法匹配最优的网络线路和算力节点。 当算网同时承载数量巨大的多种算网业务时 ,简单的算法无法支撑,需要借助机器学习或神经网络等AI能力进行全局最优的匹配。 入云专线 重点攻关技术点 统一量纲 联合优化算法 业务指标设计 业务指标分解 关键技术能力3:智能—意图驱动的算网自智 智能化是面向超大规模、高复杂度、高动态的算网环境的必然选择 感知智能需求 快速获取分析全域实时的计算、存储、网络、数据资源,以及云、边、端分布情况和运行情况,实现智能态势感知 单域信息查询跨域信息整合分析 数据图谱自动构建端到端数据链可视的分析结果 ··· 编排智能需求 业务的创新和随选要求算网编排层逐渐实现智能编排 手动模型设计 按需、自动设计匹配模型 编排模型自优化编排准确度提升 ··· 运维智能需求 高复杂度、高动态的算网环境,以及算网的多管理对象、业务的高精度SLA需求均对运维智能提出较高要求 运维对象高效管理资源、业务的灵活、按需动态调整业务的高实时性SLA要求 ··· 意图驱动 人工驱动 ··· 实时自动感知 静态信息获取 随着AI技术尤其是大模型的创新和发展,算网大脑引入AI能力,辅助甚至完全替代人工,实现业务、产品的智能化需求解析、编排方案智能设计、业务开通和运维的端到端智能保障。 重点攻关技术点 意图识别 智能方案设计 自动化开通 智能保障优化 算网大脑功能架构设计 算网大脑包含设计、编排调度、感知接入、能力接入和智能5方面核心功能,并通过能力网关接入标准化算网能力。 算网大脑 标准化接口 标准化接口 网络域能力网关 算力域能力网关 ··· 算力网络运营层 标准化接口 智