计算网络化研究报告 (2022年) 版权声明 本白皮书版权属于算网融合产业及标准推进委员会,并受法律保护。转载、摘编或利用其它方式使用本白皮书文字或者观点的,应注明“来源:算网融合产业及标准推进委员会”。违反上述声明者,编者将追究其相关法律责任。 参与编写单位 中国信息通信研究院、北京航空航天大学、国家超级计算济南中心、国家超级计算天津中心、天翼云科技有限公司、曙光智算信息技术有限公司、国网信息通信产业集团有限公司北京分公司、联想(北京)信息技术有限公司、中电云计算技术有限公司、北京华恒盛世科技有限公司、中国联合网络通信集团有限公司、北京并行科技有限公司、北京北龙超级云计算有限责任公司、联智科技(北京)有限公司、戴尔股份有限公司、浙江九州云信息科技有限公司、亚信科技(中国)有限公司、上海即算科技有限公司、芯启源电子科技有限公司 主要撰稿人 宋平、穆琙博、宋尧、刘轶、王哲、毕立波、刘弢、张玮、谭立状、冯景华、徐斌、艾天翔、杨莉、王春新、邹颖、柴瑶琳、党小东、张云畅、韩维娜、崔吉顺、张洋、陈沙克、苏斌、王文星、张岩、王施霁、刘爽、乔楠、甄亚楠、郭宇、付鸿雁、吴跃、胡卫国、苏楠、郭建超、马雷明、王真容、王琛琛、辛少帅 为了满足数字化应用多样化的算力处理需求,以超级计算、云计算、智能计算、边缘计算为代表的各类算力服务,通过差异化的服务能力,赋能行业数字变革,计算网络化的出现使得各种设备、系统、服务和应用之间可以实现高效、灵活、安全、可靠的互联互通,从而带来提高工作效率、优化资源配置、改善生活质量、促进可持续发展等优势。 本研究报告旨在探讨计算网络化的概念、内涵与主要特征、典型实践、应用案例以及对计算网络化发展趋势展望。本研究报告是对计算网络化的一次深入探讨和研究,希望能够为相关从业人员提供有益的参考和借鉴。同时,也欢迎广大读者提出宝贵的意见和建议,共同推动计算网络化的快速发展。 一、计算网络化是算网融合发展的必然路径1 (一)算力已成为促进数字经济发展的核心引擎1 (二)算力全面互联充分满足数字时代发展需求3 (三)计算网络化以算网融合为目标持续演进4 二、计算网络化概念、内涵与特征7 (一)计算网络化基本概念与内涵7 (二)计算网络化主要特征8 三、计算网络化典型实践13 (一)概述13 (二)分布式云14 (三)边缘计算18 (四)高性能计算云21 (五)智能计算25 四、计算网络化应用案例30 (一)超算互联网应用方案30 (二)工业制造领域智能质检方案32 (三)音视频领域边缘VR方案35 五、计算网络化发展趋势展望36 (一)建立健全标准体系,引导计算网络化良性发展36 (二)加速构建网络基础设施,推进算力全面互联37 (三)夯实计算网络化技术底座,实现多元算力一体协同37 (四)智能算力全面发力,助力AI大模型应用落地37 缩略语38 参考文献40 图12022年算力市场规模统计2 图2计算网络化发展的三个阶段5 图3计算网络化主要特征8 图4计算网络化典型实践对比14 图5分布式云参考模型16 图6边缘计算参考模型20 图7HPCCloud满足各行业算力需求22 图8高性能计算云参考模型23 图9智能计算服务参考模型27 图10“算力生产-算力互联-算力配给”融合的超算互联网31 图11超算互联网直连网络拓扑31 图12基于区块链的数据共享访问控制机制32 图13工业质检典型场景部署架构34 图14“5G+云VR”网络架构36 一、计算网络化是算网融合发展的必然路径 (一)算力已成为促进数字经济发展的核心引擎 《中国数字经济发展研究报告(2023年)》显示,数字经济作为我国国民经济的重要支柱地位更加凸显,数字经济规模首次突破50万亿元。我国数据资源丰富,数据产量达到6.6ZB,同比增加29.4%,占全球数据总产量(67ZB)的9.9%。日益丰富的数字化场景、海量的数据规模与复杂处理需求,进一步驱动算力规模持续扩大,加速算力技术创新升级。根据IDC《2021-2022全球计算力指数评估报告》的相关数据显示,国家计算力与GDP的走势呈现显著正相关,计算力指数平均每提高1点,国家的数字经济和GDP将分别增长3.5‰和1.8‰。 在数字化应用需求驱动下,我国正统筹推进算力基础设施建设,助推产业转型升级与科技创新。2021年,国家发改委等四部门联合发布《全国一体化大数据中心协同创新体系算力枢纽实施方案》,布局建设全国一体化算力网络国家枢纽节点,构建国家一体化算力服务平台;同年 ,工信部发布《“十四五”信息通信行业发展规划》,提出建设形成多层次算力设施体系;2023年,中共中央、国务院印发了《数字中国建设整体布局规划》,系统优化算力基础设施布局,促进东西部算力高效互补和协同联动。在国家政策的支持下,2022年我国算力总规模达到180EFlops,居全球第二,我国中东部省份率先布局算力设施。 (a)超级计算市场规模(b)云计算市场规模 (c)边缘计算市场规模 (d)智能计算市场规模 来源:中国信息通信研究院、沙利文等研究机构发布的报告 图12022年算力市场规模统计 为了满足数字化应用多样化的算力处理需求,以超级计算、云计算 、智能计算、边缘计算为代表的各类算力服务,通过差异化的服务能力 ,赋能行业数字变革。如图1所示,截止至2021年,我国各类算力市场规模持续增长,算力服务能力迎来全面发展。在超算方面,我国已经进入E级计算时代,超级计算机规模与美国呈现“并跑”态势;随着众多互联网企业加入,超算服务质量不断提升,超算产业迎来新格局。在云边算力方面,以云服务为基础的算力服务具备泛在化、普惠化和标准化的特点,云原生技术持续落地,带动云边算力架构与应用性能的全面提升。在智算方面,人工智能计算的需求高速增长,促进智算中心基础设施规 模部署,智算服务即将进入社会生活的方方面面。此外,国家“十四五”规划聚焦高端芯片、人工智能关键算法等关键领域,全面布局人工智能技术。 (二)算力全面互联充分满足数字时代发展需求 行业数字化转型助推消费互联网向产业互联网迈进,不论是传统的消费互联网还是新兴的产业互联网,对各类算力的全面互联、算力服务一体化均有强烈需求。在消费互联网方面,消费用户规模持续增长,已经突破10亿。手机、汽车、电视、家庭网关、VR设备等消费用户所使用的智能终端设备越发多元。海量数据处理正在向边缘扩散,根据Gartner预测,到2025年超过50%的企业关键数据将在数据中心以外或云以外的地点创建和处理,云/边/端算力协同已成为基本能力要求。在产业互联网方面,大科学装置、智能制造、智慧安防、车联网等领域数据爆发式增长,并在实时性、精确度方面提出了更高要求,例如:中国天眼FAST天文观测每秒产生6GB数据,对观测数据的计算分析要求高速传输,便于更快发现科学目标;车联网路侧计算设备端到端处理时延宜小于100毫秒且车辆信息检测精度不小于95%。此时,单一算力已难以满足需求,需利用高质量网络实现算力中心之间的互联互通,形成更为强大的算力资源。 各类行业不同应用场景均需要算力之间相互协同,满足应用处理需求。例如,在交通行业的车路协同场景中,智能网联汽车控制系统要求云边端算力协同调度,将人、车、路、云的物理空间、信息空间 融合为一体,实现智能网联汽车交通系统安全、节能、舒适及高效运行。此外,气象行业通过国省跨域超算算力统筹与算力资源统一服务,应对未来气象应用对算力的挑战。 不同数字应用的执行过程各具特点,利用算力互联可以进一步提升应用执行效率。例如,在如材料基因组工程的高通量计算,可充分利用计算任务间的松耦合性,将任务分配到分散的可用节点,充分利用算力互联网络连接的各算力的闲置资源;在生物信息、智慧病理等领域,边缘侧的测序仪将获得的测序数据作预处理,通过网络传到算力中心进行进一步处理,实现云边协同;在海气耦合模式中,WRF和ROMS应用之间耦合较弱,可以将不同应用映射到不同的算力中心,并通过高速互联网络进行协同计算。 综上所述,从宏观行业数字化发展,到不同行业数字化场景的需求,再到各类数字化应用执行,算力设施互联互通、算力服务一体化发展已成为满足数字化转型需求的关键能力,是现阶段算网融合发展的必然路径。 (三)计算网络化以算网融合为目标持续演进 如何便捷地获取并使用算力,一直是人们追求的目标。“网络计算”的概念起源于20世纪80年代计算机网络的出现,这也是计算网络化概念的雏形。网络计算强调通过网络连接网上分散的计算机,汇聚网络连接的各类硬件和软件资源,形成能力更为强大的计算系统[1]。 图2计算网络化发展的三个阶段 以算网融合为最终目标,计算网络化概念从20世纪80年代开始 持续演进发展。在40年来的发展过程中,业界涌现了众多典型技术实践。本报告将计算网络化发展历程归纳为三个阶段,即单机独立运算阶段、域内规模互联阶段、跨域全面互联阶段,如图2所示。 单机独立运算阶段(20世纪80年代网络出现以前),以个人电脑、工作站为代表的计算设备独立执行运算。应用只能部署、运行在一台独立的计算设备中,一台计算设备可以通过分时交互等方式运行不同的应用。在这个阶段,产业注重各类计算芯片的研发,不断突破单机的计算性能,与此同时,分布式计算等计算网络化的概念被提出,重点解决单一计算设备的性能瓶颈问题。 域内规模互联阶段(1990年至2020年),伴随计算机网络的出现与发展,各类计算设备利用网络相互协同,满足应用更高的算力需求。大规模应用可以同时部署在多台计算设备中,由不同的计算设备执行不同的处理任务。该阶段重点关注一 个区域内计算设备的互联,经历了服务器群组到小规模集群再到大规模集群的演进。随着域内算力规模的增加,任务分配方式也从原始的人工分配方式,发展到统一任务调度方式以及根据用户需求的弹性调度方式。随着集群可扩展性的不断提升,单集群能耗、集约化等问题极大限制了集群规模。 跨域全面互联阶段(2020年以后)是数字时代背景下计算网络化演进的全新阶段,重点解决单一集群规模受限,无法满足产业互联网更大规模数据处理需求等痛点问题。该阶段包括超算算力、智算算力、云算力、边缘算力等在内的各类算力,通过标准化的接口,利用IPv6+、算力网络、SD-WAN等先进网络技术,实现跨域全面互联,并提供一体化的算力服务。应用的部署不再受到体系架构、地理位置等因素的制约,可专注于完成自身任务,无需关心算力资源情况。 计算网络化的跨域全面互联阶段体现了计算技术与网络技术融合程度的不断深入,网络不再仅仅发挥数据流转作用,而是更多的助力计算任务的高效执行。得益于域内规模互联阶段网格计算等技术对算力跨域互联的积极探索,在跨域全面互联阶段,融合多元算力的一体化算力服务能力也将得到了全面提升。 二、计算网络化概念、内涵与特征 (一)计算网络化基本概念与内涵 计算网络化以算网融合为最终目标,旨在利用高质量互联网络连接算力软硬件资源,构建算力规模更大、服务能力更强的算力系统,其中高质量互联网络是计算网络化的能力基础,一体化算力服务是计算网络化的能力核心。计算网络化的本质是一种算力资源服务,未来企业客户或者个人用户不仅需要网络和云,也需要灵活的把计算任务调度到合适的地方。 计算网络化是算网融合发展的重要趋势、必然路径与发展阶段。计算网络化应满足以下条件: 基本内涵:计算网络化强调以计算服务为核心,网络是算力服务的基础,计算网络化中网元设备不提供算力服务。 呈现形式:计算网络化最终要构建一个算力全面互联的一体化算力服务平台/系统。 能力主体:计算网络化依赖于各类算力设备与多元算力中心提供的算力服务能力。 以网助算:计算网络化利用高质量互联网络保障计算服务过程中的网络质量,并可通过网络的调度与优化,提升应用执行效率。 (二)计算网络化主要特征 图3计算网络化主要特征 在千行百业数字化应用需求的驱动下,计算网络化发展迎来了新阶段。算力多元分散、网络广域互联、资源弹性供给、服务多维一体、应用规模部署成