您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[头豹研究院]:2022年中国DPU行业白皮书 - 发现报告
当前位置:首页/行业研究/报告详情/

2022年中国DPU行业白皮书

电子设备2022-05-10头豹研究院机构上传
2022年中国DPU行业白皮书

中国:DPU行业 白皮书|2022/05 头豹研究院谨此发布《2022年中国DPU行业 白皮书》。本报告旨在分析DPU发展现状、产品特点、技术动向及发展趋势,并识别中国芯片 DPU将成为继CPU、GPU的"第三块主力芯片” DPU具备高度灵活可编程性,其功能可通过软件定义向网络、存储、安全等应用进行延伸。通过灵活地运用DPU的功能,在满足不同应用场景对于释放算力提高数据处理效率需求的同时,还具有贴合具体应用场景需求的能力,如助力形成信息安全解决方案等。因此,DPU具有渗透众多应用场景的潜力。 厂商与海外芯片厂商的差异,从而判断中国 DPU行业的现状与发展机遇。 基于全文的论述,本报告在最后分享了作者对于行业未来发展理解与思考,旨在倡导行业内外各方加强合作,从而推动中国DPU行业与中国芯 片行业整体发展。 本报告所有图、表、文字中的数据均源自弗若斯特沙利文咨询(中国)及头豹研究院调查,数据均采用四舍五入,小数计一位。 产品概念逐步具象化,蓄力延伸众多领域 不断改进产品与应用场景的贴合度,打磨DPU产品在锚定应用领域的商业化能力是现阶段发展的重点,DPU概念在这发 展过程中将逐步具象化,行业外部对 DPU认知也将逐渐加强。基于现阶段所积累的技术与应用场景理解,芯片厂商将持续扩大DPU所能覆盖的应用场景。 海外与中国芯片龙头厂商发展进度相近 海外芯片龙头厂商基于自身影响力率先打开市场,中国芯片龙头厂商也紧步跟上产品将逐步落地应用。在行业发展初期,双方皆处于接受终端应用验证的阶段,发 展进度相近。 打造生态是中国芯片厂商把握机遇的关键在打磨DPU大规模商业化的阶段,拥有较强适配性并释放客户开发能力的产品更具有竞争优势,软件生态则是形成这一竞争优势的关键。此外,中国芯片厂商还可以打造产业链生态以及横向的协同生态提高研发效率、打造多样化产品,从而把握行业发展的机遇。以DPU为中心,联合芯片行业各方协同发展,将有望推动中国芯片行业整体发展。 无DPU的网络数据处理结构 智能驾驶端到端业务时延 DPU概况 DPU为解决算力供需错配问题而生,有多应用场景的发展潜能 >定义与技术解析 主要功能 必要性分析 eadleo.com 21LeadLeo 定义与技术解析 DPU是将“以计算为中心"的网络数据处理逻辑改变为“以数据为 中心”,并提高数据处理效能、降低其他计算芯片性能损耗的新一代计算芯片,也是未来提升计算系统整体性能的关键芯片 基本定义:DPU全称DataProcessingUnit或专用数据处理器,是以数据为中心、IO密集型的 芯片;采用软件定义技术路线支撑基础设施资源层虚拟化,具备提升计算系统效率、降低整体系统的总拥有成本(TCO)的能力。 DPU将成为继CPU与GPU后的“第三块主力芯片” 在计算模型复杂化、算力要求提升的趋势下,GPU的诞生减轻了CPU的计算负担,显著提升算力;而算力要求提升的背景是数据量、数据类型增多,为了进一步提升计算系统的数据处理与调度的效能,DPU应运而生。DPU主要处理网络IO与内部虚拟IO,释放CPU的算力。 通过不同的软件定义,DPU还可延伸至储存头安全、服务质量管理等基础设施层服务。 DPU将数据处理逻辑从“计算为中心"改变至数据为中心” 在DPU出现之前,网络数据处理逻辑以CPU为中心,按顺序执行:即传输终点为GPU、 DSA、主存的数据流都必须经过CPU调度。这一结构也造成计算系统的两大局限:数据处理效能受限与CPU上层应用计算能力受限,而DPU的出现将数据集中处理、调度,不仅能够缩短数据所需经过的路径、减轻CPU负担,还能在提高数据处理效能的同时,降低其他计算芯片性能损耗,最终显著提升计算系统整体性能。 无DPU的网络数据处理结构 使用DPU的网络数据处理的结构 CPU 主存 GPU DSA CPU GPU DPU DSA 主存 Nic 网络 网络 "以数据为中心"的数据处理结构,网络数据由DPU处理、调度、I/O加速 "以计算为中心"的数据处理结构,所有网络数据都需要经过CPU计算、调度 网络数据接入与输出路径过长,导致数据处理速度以及整体计算性能受限头 使用DPU的结构能达到专项专用,提高整体性能:DPU可直接与其他计算芯片进行数据调度,缩短数据 需经路径,从而提高数据处理的效能,降低其他计算芯片的性能损耗 主流的DPU三种技术路线对比 不同核心处理器的类别 主要优势 主要劣势 编程难度高:对软件开发不友好 具有灵活可编程性 基于FPGA设计的DPU 性价比低:成本较高;存在资源余问题,导致芯片面积大、功耗高 可编程性低:受ASIC所定义的功能限制,缺乏在新应用场景渗透的能力 在限定的范围内可实现高性能、低功耗、低成本 基于ASIC设计的DPU 基于 性价比较高:两种结构的可编程灵活性皆较高,且成本低、功耗低 SoC-GP 基于SoC-GP:依靠通用处理器核对 数据进行处理,受通用处理器架构局限,网络数据处理性能有限 基于 MP 设计的DPU 基于SoC-NP:具备强网络数据处理能力,贴合众多DPU应用场景,支持P4、C语言编程 基于 SoC-NP 从基本属性与现有发展趋势来看,SoC为DPU最佳的技术路线 FPGA与ASIC劣势明显:基于ASIC的DPU只能在限定范围内实现高性能、低功耗 低成本的作用但是ASIC灵活可编程性低,难以在网络数据格式、报文持续迭代更新与扩充的环境下实现发展;基于FPGA的DPU具备灵活可编程性,但是开发人员需 要同时了解硬件与网络的知识才能对FPGA进行编程,编程复杂度较高,所需要投入研发力量大,且芯片成本高,大规模部署将显著提高成本,不利于DPU的发展。 SoC正逐步成为DPU最佳技术路线的行业共识,NP分支路线最贴切DPU用于数据处理的定位:随着DPU逐步发展,早期使用基于FPGA与ASIC的DPU的厂商也开始趋于使用基于MP(众核)设计的DPU豹(如FPGA+CPU、ASIC+CPU),即 SoC的技术路线。这样做的核心是通过堆叠处理器核提高可编程性,实现整体性能的提高,且能够降低成本。SoC路线下有两条分支,包括GP(通用处理器)、NP(网 络处理器),SoC-GP通过堆叠通用处理器核能够很好地提高灵活可编程性,但是由 于通用处理器架构的限制,导致处理网络数据的能力有限;而NP则是为网络模型设计,能够实现更优的处理网络数据性能,且支持多种高级语言,对开发者较友好。综合这些基本属性,SoC-NP能够接近ASIC的高性能能力,同时也能提供高灵活可编程序与较低成本的能力,是DPU最佳的发展路线。 DPU架构分为硬件层与软件层,硬件层的核心在于数据平面的高性能与高可编程性; 软件层能力则决定DPU效能,并且是DPU实现强大增长价值的关键。 DPU的硬件与软件架构 DPU硬件层的主要技术特征在于强大的数据平面性能 DPU的数据平面与控制平面由各种不同的处理器核构成,均具有可编程性,其中数据平面的具体功能主要有高速数据包处理、虚拟化协议加速、流量压缩等;控制平面则负责管理DPU设备运行以及计算任务和计算资源的配置。 作为数据专用处理器,DPU硬件层的核心在于强大的数据平面性能与可编程性。具体而言 DPU的数据平面通常集成多个同种类或不同种类的处理器核,能够满足大量不同类型的数据与业务处理;同时还需要具备高可编程性,从而满足硬件维护以及不同应用的设计、开发需求。 DPU的核心价值主要体现在软件层能力头豹 DPU将原本在CPU、GPU等处理器所处理的数据或业务先剥离,再集中进行处理,其所体现 的本质是异构计算的应用,而异构计算的关键在于软硬协作,包括DPU自身的软硬协作以及DPU与主机的CPU、GPU等处理器的软硬协作。其中,通过软件适配来协同调度好各处理器编程框架,从而为开发人员构建便于使用的开发环境,是充分发挥DPU效能的重中之重。 此外,通过运用具体场景的软件,DPU可满足不同客户对网络、安全、存储等应用的具体需求,并延伸至不同的行业领域,因此软件也是DPU实现强大增长价值的关键。 纵向的生态,包含产品从研发、生产到符合终端应用适配性要求所涉及到的环节,主要包括软件生态与产业链生态。 盖度以及上游的 EDA、IP核等 产品生产 基 研发生产的过 于 7程 软件生态(至关重要的一环):软件生态具体表现形式为DPU软件功能覆盖的广度与适配性程度,是发挥DPU软件层能力的关键。软件的丰富度与适配性能力将直接影响客户能否采购产品投入使用以及客户在不同应 应 用场 EDPU !提供打磨产品能力、!增强产品影响力的I基础 景理 投使用的过 入 用场景中的开发能力。 产业垂直应用覆盖的生态:产业垂直应用覆盖的生态代表了DPU产品与上游及下游组成部分的紧密程度。通过自主布局或与厂商合作布局上游环境可提高产品能力与研发效率;与下游深度合作可加深应用场景的理解,积 解研发与 改进 程 涉及卸载功能的软件功能广度与覆盖度、下游的客户等 终端应用 累技术,并持续改进产品。 面向客户的横向的DPU生态 横向的DPU生态有助于客户高效地解决问题 横向的开放协同生态具体表现形式为DPU产品与其他芯片厂商的产品的适配性,与之对应的是横向的封闭协同生态。 I横向的生态指代与DPU与其他芯片产品构成的 !生态,目标在于为客户提供不同芯片产品的搭:i配方案 开放的协同生态:通过厂商间合作,加强产品之间的适配性,从而提供多样化的高集成产品或形成适配产品推荐的销售模式。 三GPU三 =DPU 三CPU三 三存储三 封闭的协同生态:指DPU厂商利用自身产品 进行集成或捆绑销售。 客户使用相互适配的芯片,有助于降低寻找或验证芯片适配性所要花费的时间与成本,可以更高效地解决芯片配置的问题。 终端应用 主要功能 通过灵活使用DPU可实现的功能并运用软件进行编程,可实现不同场景下的功能需求覆盖,具体的应用可包括网络、存储安全等 灵活使用DPU可实现的功能以及其高度灵活可编程性可满足不同应用场景的需求 DPU具备的功能主要有5种:1.算力卸载:DPU具有高度灵活可编程性,可将CPU的基础层 业务(如网络、存储、安全的协议处理等)卸载,从而释放CPU算力,使其专注于上层业务; 2.虚拟网络控制面隔离:配置多核CPU的DPU具有网络控制平面,将控制平面从主机中完全隔离,可以服务于各种资源能力的组合和伸缩;3.主机侧总线通信的延展:基于DPUPCle Endpoint、PCleRootComplex的能力,可对系统总线进行延展,使GPU等专用算力芯片的算 力不再受限于总线能力和PCle插槽数量;4.网络侧无损网络传输:凭借具备多个处理器核形 成的数据平面能力以及高性能网络接口的关键特征打造DPU解决方案,降低长尾时延,提供更可靠更高效的传输网络;5.流量测量和故障检测能力:借助可编程的能力和内置处理器的能力,卸载安全管理功能,可提高智能网卡检测到故障的能力。 通过灵活使用DPU的功能与运用软件对DPU编程,功能可根据应用场景进行延伸,如在网络方面,通过算力卸载于网络侧无损网络传输可提高网络数据处理整体性能。此外,DPU还能够实现存储卸载及安全功能卸载另外两大应用。 DPU的关键特征以及主要功能 DPU关键特征 架构类别 主要功能 网络卸载 核心在于释放主机CPU在网络数据处理上消耗的算力 网络功能卸载需求伴随云计算网络而生 在虚拟化的云计算网络架构中,同一台服务器上的虚拟机之间以及不同服务器上的虚拟机之间都需要进行流量隔离和互通;此外,与物理机不同,虚拟机可以动态创建、删除或从一台服务器迁移到另一台服务器,这些不同的操作都可能带来算力损耗。为了减轻CPU的负担,网络功能卸载的需求也便随云计算网络而生。从局部云计算网络架构中可见

你可能感兴趣

hot

2021中国DPU行业发展白皮书

信息技术
赛迪智库2021-12-08
hot

DPU金融行业发展白皮书:打造绿色节能的金融云平台

金融
北京金融科技产业联盟2023-11-15
hot

中国移动DPU技术白皮书

信息技术
中国移动2022-07-15
hot

云计算通用可编程DPU发展白皮书2023

信息技术
中国移动2023-04-04