中国移动第四届科技周暨战略性新兴产业共创发展大会 算力网络子链最新工作进展 算力网络子链工作专班中国移动研究院张昊2023年8月 中国移动第四届科技周暨战略性新兴产业共创发展大会 目录 contents 1算力网络产业链工作进展及成果汇报 2算力网络工作组组长任命 3算力网络产业链下一步工作思考 中国移动算力网络概念的提出及发展 中国移动第四届科技周暨战略性新兴产业共创发展大会 中国移动“以网强算”提出算力网络全新理念,发挥我国网络优势,形成中国特色算力发展新路径。 两年来持续开拓创新,推动算力网络成为业界广泛共识,上升为国家重大发展方向和战略性新兴产业重要领域 提出新概念 杨杰董事长提出“算力网络”全新理念 发布新理念 发布中国移动 《算力网络白皮书》和发展倡议 融入新战略 确立“5G+算力网络+能力中台”的发展战略 开创新方向 提出十大技术发展方向和核心技术体系 打造新平台 启动算力网络试验网CFITI和算网服务体系1.0 构建新装置 与中国算力网、信息高铁联合打造科学装置 组建新战队 形成算力网络产业链,组建攻关战队 设施 初步建成全国性算力网络基础设施 应用 创新打造任务式服务和算力并网新模式、新业态 技术 制定了100余项国际和行业标准开创“算网一体”原创技术体系 产业 重塑产业生态,推动产业链跨域融通和融合创新 算力网络核心理念:推动算力成为与水电一样,可“一点接入、即取即用”的社会级服务 原先分散孤立的算力节点通过网络连接在一起 ,构成立体泛在的算力集群 算力协作化、集约化、普惠化 用户不用关心资源类型和位置,随需申请,随需使用,随需调整 打开算龙头就可以便捷使用算力 叠加AI、大数据、区块链等能力要素,改变分离式服务供给为融合服务供给 实现一体化服务供给 网络无所不达算力无所不在智能无所不及 算力网络子链3+1总体工作思路及举措 围绕关键技术攻关、科学装置构建、产业生态建设三个方面,着力提升产业韧性,打造国家算网产业发展新高峰 关键技术攻关打造原创技术 深化科学装置合作孵化新技术 聚集产业繁荣生态 关键技术创新突破培育新优势 算力网络科学装置 研讨会、峰会等多种形式牵引产业发展 智算GPU DPU 全以太调度 高速互联芯片器件 存算一体 RISC-V 算力原生算网一体 算力并网 算力交易 东数西算新业态智算中心EP级 算力网络子链工作大会 多样性算力联盟 算力网络技术与产业大会算力大会 移动云大会 多元投资助力 在关键的产业节点上加大投资助力 秘书处工作专班 专家委 算力网络子链组织架构:1+1+4+14 算力网络子链 1个 专家委 1个 秘书处 工作推进组 4大 工作推进组 算力基础设施组网络基础设施组算网服务协同组算网应用组 存算 新型一 攻关 攻 14个智算体 工作战队战队关战队 DPU 攻关战队 RISC -V攻关战队 “芯 合”算力 算力软件 原生攻关 攻关战队战队 “芯 网新型 ”IP全光网攻 底座关战 攻关队 战队 高性CAN 能以算网 太网一体 络攻攻关 关战战队 队 算力并网及交易攻关战队 东数智算云网 西X应用边融 战队战队合战队 算力网络子链发展重要里程碑 中国移动第四届科技周暨战略性新兴产业共创发展大会 算力网络子链自成立以来,在技术部带领下,云能、IT公司、设计院等的支持下稳步推进,建机制、搭平台,持续开展产业和技术活动,并积极提交算力网络策略建议报告,推动算力网络上升为国家重要发展方向 10月,创客马拉松大赛算力网络专题赛、算力网络试验示范网“百灵鸟”计划 12月,与鹏程实验室、计算所联合启动算力网络科学装置建设 12月,协同创新基地合作入驻、新型智算和DPU实验室共建 3月,算力网络子链第一次工作大会暨专家委和子链工作研讨会,成立4个工作组,14支攻关战队 2022年11月 2023年2月 2022年10月 2022年12月 2023年3月 2023年6月 11月,举办“移动云杯”算力网络应用创新大赛总决赛;发布移动云openAPI2.0、移动云量子计算平台 12月,发布存算一体/算力原生/算网大脑/智算网络4本白皮书 2月,北京市经信委组织召开算力网络研讨会 2月,与中科院计算所成立联合创新平台 6月,算力网络技术与产业大会发布了算力网络十大产业发展方向暨产业链发展计划 10 CAN算网一体:如何设计网、算多要素融合感知的一体架构和协同模式转变 算力网络子链十大需求 1 新型智算:如何构建标准统一、兼容开放、技术自主的智算中心 2 算力原生:如何融通智算生态解决应用跨架构迁移问题 3 存算一体:如何加速存算一体产品化落地 4 标准开放DPU:如何通过DPU构建新型算力基础设施底座 5 数据中心RISC-V:如何带动RISC-V在数据中心多核心主处理器、硬件加速器等领域的创新、发展和成熟 6 应用及软件国产化:如何提高算力网络应用及软件自主可控度问题 7 算力并网及交易:如何构建多方可信共享的新型算网交易平台 8 协议统一的IP底座:如何在端、边、算之间灵活互联基础上提供差异化、确定性的连接质量保障 9 新型全光网:如何解决灵活高效组网、高速传输、新型光纤等竞争性焦点技术问题 工作成果1:关键技术攻关--通用计算 标准——算力评测体系 评测——“芯巢”多样性芯片孵化平台 生态——多样性生态构建 已完成CPU、GPU/AI卡、网卡部件评测标准制定 •Intel、海光、鲲鹏3大CPU •英伟达、寒武纪等5大GPU/AI卡 •Intel、MLX、网迅等3大网卡 正在制定Raid卡评测标准 获得行业高度认可 •ODCC重要成果、CCSA部件标准立项 “芯巢”孵化平台2.0 支持CPU、GPU/AI、内存、SSD等方面的自动化测试验证 CCSA成立多样性算力产业及标准推进委员会 •已集结70家单位 •发布《多样性算力技术愿景白皮书》、 《多样性算力商用部署白皮书》 •成立多样性算力生态联合实验室 工作成果1:关键技术攻关--DPU DPU软件实现方式差异大,业界存在异厂家DPU与服务器、云平台软件定向开发适配成本高的问题 •软件方面:围绕管理、网络、存储、计算、安全五大软件系统,定义DPU软件功能要求和交互接口 •硬件方面:围绕结构和供电、散热、运维、带外管理等四大方面,统一DPU与服务器硬件标准化 01 管理系统 •弹性裸金属管理功能 •虚拟机、容器、裸金属统一管理 02 网络系统 软 件03存储系统 •虚拟交换网络功能,RDMA拥塞控制机制 •控制面与转发面解耦接口 •vDPA接口 •RDMA兼容性编程接口 •存储网络协议iSCSI、NVMe-oF •存储接口virtio-blk/NVMe 1、统一服务器结构及供电最大能力 硬2、统一硬件边带信号定义及带外管理功能边界 件3、统一散热能力4、统一运维策略 04计算系统 05安全系统 •HostOS裁剪,内核协议栈精简优化 •Hypervisor前后端分离架构,libvirt接口 •络数据加解密 •虚拟化安全增强 工作成果1:关键技术攻关--体系性布局智算 面向基础通用大模型孵化,中国移动构建NICC新型智算中心技术体系,围绕五大核心技术特征全面推进,打造标准统一、技术领先、兼容开放的智算底座 九天 AI应用使能 算 制定扣卡服务器的统一技术和评测标准,推动产业成熟 NICC新型智算中心技术体系重点工作 智算框架 智算原生 TesnsorFlowPyTorchPaddlePaddleDeepspeed “芯合”算力原生 跨架构编译器算力抽象运行时ROCmCUDACANN ... ... 管 智算运营 创新提出多元融合存储技术方案,实现块、文件和对象三种存储方式统一 编排调度存 计量计费 原创提出全调度以太网GSE技术,被誉为智算中心网络的中国方案 算力交易 能力开放网 智算设施 异构算力池化 裸金属实例虚拟机实例容器实例 创新基于API转发的GPU池化方案,实现资源的细粒度分配和跨资源池一体调度 FCAPS日志资产 管理管理管理管 算GPU集群算力 存多元融合存储 网高速无损网络 CPUGPU 文件对象块 高性能全以太 RoCE 效 算力存储网络 引入服务器冷板式液冷方案,有效降低数据中心PUE 管理管理管理 效 智算基建 液冷整机柜高效供电 冷却水系统 工作成果2:关键技术攻关--打造原创技术 原创技术 领先技术 携手多家外部单位,通过主导关键技术国内外标准立项、搭建原型产品和试验网验证等多种措施进行原创技术研发、测试,开展原创性技术突破;通过产学研联合研发、联合测试验证等方式,开展引领性技术攻关 算网一体 •亮点&成果:IETF布局算网一体关键技术标准体系,ITU牵头算力网络(CNC)标准体系,CCSA主导完成算力路由关键指标体系及评测方法立项 •解决问题:构建自主创新的算网一体架构和技术体系,通过企业联合、高校载体及试点验证、引领产学研协同创新实践。 算力原生 •亮点&成果:面向业界发布算力原生白皮书,OIF牵头成立算力原生工作组,ITU、CCSA主导完成算力原生国内外标准立项。 •解决问题:完成算力原生软件平台的总体方案设计,推进算力原生原型产品的研发和关键技术验证工作 全调度以太 •亮点&成果:面向业界发布全调度以太白皮书,正在筹备成立推委会。 •解决问题:提升智算中心服务器间通信带宽,推进原型产品研发 存算一体 •亮点&成果:完成研发基于忆阻器的存算一体SoC芯片,单芯片集成突破300万个忆阻器,峰值算力达15TOPS,能效超过2TOPS/W;完成研发支持标准接口的存算一体芯片计算板卡,为端边设备提供高性能、低功耗的算力;完成研发面向忆阻器存算一体SoC芯片的半自动软件计算引擎,软硬协同提升芯片性能,有效降低用户开发和部署门槛。 •解决问题:研发基于存算一体芯片的计算板卡以及标准化存算一体软件计算引擎 RISC-V •亮点&成果:选取数据中心通用场景进行可行性分析,以业务为基反推对RISC-V指令集需求,牵引数据中心RISC-V芯片产业优化方向。 •解决问题:联合产业伙伴推动形成数据中心通用场景进行可行性分析报告。 工作成果3:算网服务和应用--打造新模式新业态 升级核心产品体系,发挥算网新特性,融合多要素 发布“算网服务1.0”,打造更可靠、更高效、更智能、更便捷的算网服务体系 打造算力产品 拓展新方案新服务 探索新业态新模式 ... 云XR云游戏云魔百和 升级云网融合产品 东数西训 东数西渲 任务式服务 算力并网 云专线云互联5G云梯 ... 东数西算 中训边推 自动驾驶元宇宙 工作成果3:算网服务和应用--构建算网大脑 算网大脑是IT和CT深度融合贯通的集中体现,是算网一体共生发展的关键系统,推动算网由分域管理向融合统一演进。明确了算网大脑架构及功能设计,构建算网大脑原型系统并进行系统性验证。 算力网络运营层 算网大脑 算网能力开放 算网融合编排算网智能化 算网能力开放中心 算网编排中心 算网智慧中心 算网调度中心 算网感知中心 算网原子能力融合供给 多要素一体编排 意图感知、网络自智 算网跨域调度算网数据感知 算力管控 网络管控 安全管控 ... 跨领域、跨专业统一调度 算网全域感知,端到端服务质量保障 算力网络基础设施层 工作成果4:协同创新基地-算力网络实验室 建设目标:为打造泛算智联的端到端快速验证平台,算力网络实验室规划六大领域,12个子实验室,推动算力网络关键技术、标准及产业应用生态成熟,助力算力网络目标愿景加速实现 CICT创新中心实验室 新型智算实验室 DPU开放实验室 算网IP底座实验室 •算力网络实验室当前同北京大学、暨南大学、北京邮电大学、中科院计算所、华为、中兴、浪潮、新华三、曙光、烽火、锐捷、诺基亚、趋动、瀚博、英特尔、初灵、山水、奥普泰、格林威尔、为是科技、迈普等20+合作伙伴有13个合作项目 •算力网络实验室计划开放18项能力(2023年新增8项能