您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中国联通]:2023年中国联通DPU网络域场景应用白皮书 - 发现报告

2023年中国联通DPU网络域场景应用白皮书

信息技术2023-09-11中国联通杨***
AI智能总结
查看更多
2023年中国联通DPU网络域场景应用白皮书

DPU网络域场景应用白皮书 中国联合网络通信有限公司研究院下一代互联网宽带业务应用国家工程研究中心 2023年08月 前 言 NFV技术在5G网络建设中已普及应用,NFV云资源池是运营商云基础设施整体规划和建设中的网络域部分。随着5G的规模商用和6G的提出,网络业务对网络域云基础设施提出了新的需求和挑战。DPU作为一种新型计算技术,具备灵活可编程、算力卸载、安全可信和统一资源管控等特性,为NFV技术的演进提供了新思路。 本白皮书阐述了DPU技术优势和当前网络域云基础设施面临的几点问题,给出了DPU在几种典型网络域业务场景中的应用方案,分析了引入DPU面临的挑战和建议。 希望通过本白皮书的发布能引起行业的共同深入思考,为业界开展DPU和NFV演进研究提供参考,加速推进DPU和通信产业发展,助力灵活安全绿色高效的5G网络建设和万物智联的6G愿景实现。 本白皮书的版权归中国联通解释,未经授权,任何单位或个人不得复制或拷贝本建议之部分或全部内容。 联合编写单位:(排序不分先后) 中国联通集团网络部,中国联通研究院,下一代互联网宽带业务应用国家工程研究中心,联通数字科技有限公司,中兴通讯股份有限公司,深圳云豹智能有限公司 指导专家:唐雄燕,丁鼎,曹畅,王友祥,童俊杰,高功应 编写组成员:(排序不分先后) 杨文聪,王立文,杨文强,张雪贝,朱威,岳毅,隋腾飞,过晓春,刘宇龙,朱堃,郑怀林,阎松明,岳文卿,陈文斌,王雪强,孙传明,吴杨,王紫程 目录 1.背景........................................................................................................ 12. DPU技术分析........................................................................................32.1. DPU发展历程....................................................................................................32.2. DPU技术特性....................................................................................................62.2.1.灵活可编程................................................................................................. 62.2.2.统一资源管控............................................................................................. 72.2.3.算力卸载................................................................................................... 122.2.4.低时延网络............................................................................................... 122.2.5.安全可信................................................................................................... 132.3. DPU产业生态..................................................................................................173.网络域云基础设施面临的问题......................................................... 193.1.资源统一管控需求..........................................................................................193.2.通用算力损耗问题..........................................................................................203.3.转发性能问题..................................................................................................203.3.1.低时延网络传输问题............................................................................... 203.3.2.云资源池网络域的大流表需求............................................................... 223.4.潜在安全风险..................................................................................................233.5.绿色节能要求..................................................................................................244. DPU在网络域中的应用方案............................................................. 254.1.虚层卸载的虚机方案......................................................................................254.2.云化裸金属方案..............................................................................................294.3. DPU的扩展应用方案......................................................................................334.3.1.控制节点下沉........................................................................................... 334.3.2.边缘盒式一体机....................................................................................... 344.3.3.网内计算................................................................................................... 355.引入DPU的挑战与建议................................................................... 376.总结与展望..........................................................................................417.缩略语列表..........................................................................................43 1.背景 云计算通过虚拟化技术和集群管控技术实现资源共享、弹性伸缩、高可用、简化管理等特性,得到了广泛关注和应用,取得了巨大成功。通信网络也借鉴云计 算 技 术 , 在5G的 架 构 设 计 中 引 入 了 网 络 功 能 虚 拟 化(Network FunctionVirtualization, NFV),将传统的软硬一体的网络设备转换为软件网元形态,可以在基于通用设备的云资源池上部署运行,从而实现网络功能的快速部署、灵活调度和资源优化。这种用于网元部署的云平台是云计算在网络领域的落地应用,这些用于网元部署的云资源池是运营商云基础设施整体规划和建设中的网络域部分,用于支撑5G核心网等通信网络的部署和运行。 相对于公有云业务,网络域承载的通信网络业务可靠性要求高,需要在性能、稳定性等方面进行增强加固;业务种类繁多,如5GC、IMS、炫铃、新通话等不同的通信服务和网元实现信令处理、报文转发、媒体流量处理等不同功能,在业务特征、产业生态等方面差异跨度大,对云资源池的资源要求也差别大。 在5G建设进程的推进中,算力与网络不断融合,NFV及SDN技术在移动通信网络、家庭宽带网络的应用持续深入,云化网络技术成为这些业务网络保持弹性敏捷的基础。但是随着5G在垂直行业的应用和AI大模型、短视频类业务的发展,网络需要更大带宽更低时延,这就导致网络域云基础设施必须不断扩容和迭代。长期以来在摩尔定律和登纳德缩放定律的共同作用下,引领了芯片行业30年的飞速发展。但随着摩尔定律放缓、登纳德缩放定律失效,后摩尔时代通用CPU的算力提升已经无法满足当前网络域NFV业务对转发性能的增长需求。同时,随着6G愿景的提出,各种新型通信服务如VR/AR、车联网、数字孪生、智能内生、安全内生等也在逐渐崛起,这些多样化个性化的应用场景对通信网络提出了更高的要求,也将对网元功能对云资源池的安全稳定、资源利用率、运维管控等各方面能力提出了挑战。 DPU(Data Processing Unit)是源于智能网卡的新兴计算技术,也是一种IO密集型的专用处理器,采用SoC/CPU+可编程硬件方案为数据处理提供灵活高效的硬件加速服务,可支持网络、存储、安全、管理等数据中心基础设施层功能卸载(因此也被称为IPU,即Infrastructure Processing Unit基础设施处理单元),也可支持根据应用层业务需求定制加速能力。业界已经将其定位为继数据中心CPU、 GPU之后的“第三颗主力芯片”,以应对算力规模快速增长带来的挑战。 在公有云领域,DPU被用于卸载和加速云数据中心的存储访问、数据转发、安全卸载等方面,释放更多可售卖的算力资源。在网络域,DPU由于其更高的转发效率,可以进行网络报文处理降低对CPU计算资源的依赖,以更少的CPU核和服务器节点提供更高的转发性能,以此降低云资源池的能耗,推动网络域NFV的绿色节能。 2. DPU技术分析 2.1. DPU发展历程 随着云计算、物联网、大数据和人工智能等产业的飞速发展,数据中心中针对计算资源、网络资源和存储资源池化和虚拟化的需求不断增强。尤其数据中心应用中的网络正在向高带宽和新型传输体系发展,网络带宽增加的速度与CPU算力增长的速度之间的差距逐渐增大,网络数据处理占用的CPU资源也不断地增加,数据中心税的问题愈发突出。在这种背景下,DPU从传统NIC网卡逐步衍生而来,基本可以分为三个发展阶段: 1.传统基础网卡NIC:负责数据报文的收发,具有较少的硬件卸载能力; 2