专用数据处理器(DPU)性DPU能Benc基hma准rkM评etho测dolog方yan法dIm与plem实enta现tion 技术白皮书 第1.0版2022版7月 主编单位 中国科学院计算技术研究所 中科驭数(北京)科技有限公司 联合编写发布单位 处理器芯片全国重点实验室 中国计算机学会(CCF)集成电路设计专业委员会中国计量测试学会集成电路测试专业委员会 �专家顾问� 孙凝晖、李晓维、陈云霁、詹剑锋 �编委成员� 主编:鄢贵海 编委(按姓氏拼音排序):陈岩、程丽云、樊海爽、耿嘉、顾帅、黄明亮、林涵越、卢文岩、廖云坤、李明、罗梅、刘昱泽、孙伟、吴婧雅、袁晓飞、赵汝杰、赵巍岳、赵越、张社广、张宇、张宇军 本白皮书编写过程中还得到了中国电子技术标准化研究院、中国信通院技术和标准研究所、北京市经信局,国际测试委员会(InternationalOpenBenchmarkCouncil),曙光信息产业有限公司、浪潮集团、英伟达、天翼云、中国移动研究院基础所、中国移动研究院网络与IT技术研究所、上交所技术有限公司、深圳交易所、中国电信股份有限公司广州研究院、中移(苏州)软件技术有限公司、中兴通讯、京东云计算有限公司、百度、腾讯TEG事业群数据平台部、华泰证券、Ucloud、世纪互联、H3C、恒生电子、人大金仓、DaoCloud,SmartBI等机构和上下游企业的支持与协助,特此表达衷心的感谢! 本白皮书版权属于主编和联合编写发布单位,并受法律保护。转载、摘编或利用其它方式使用本白皮书文字或者观点应注明“来源:专用数据处理器(DPU)性能基准评测方法与实现,中国科学院计算技术研究所/中科驭数,鄢贵海等”。违反上述声明者,版权方将追究其相关法律责任。 第1章DPU性能评测导论1 1.1DPU评测的挑战和重点1 1.2开展DPU评测建议标准3 1.3系统测试的四个维度4 1.3.1网络维度4 1.3.2存储维度5 1.3.3计算维度6 1.3.4安全维度7 1.4内容的组织结构8 第2章DPU性能评测系统框架与测试流程9 2.1DPU测试系统(SUT)9 2.1.1单端型(Single-End)测试系统10 2.1.2端到端型(End-to-End)测试系统11 2.1.3多端型(Multi-End)测试系统13 2.2测试要求14 2.3测试活动15 2.3.1 测试选择 ................................. 15 2.3.2 测试准备 ................................. 15 2.3.3 测试执行 ................................. 15 2.3.4 测试报告 ................................. 16 第3章 面向网络的基准评测 17 3.1 基础网络加速.................................. 17 3.1.1基于DPU的基础网络加速结构.................... 18 3.1.2测试系统................................. 18 3.1.3Benchmark................................ 20 3.2 RDMA...................................... 22 3.2.1基于DPU的RDMA加速结构..................... 22 3.2.2测试系统................................. 23 3.2.3Benchmark................................ 24 3.3 虚拟交换机/路由器卸载加速.......................... 26 3.3.1基于DPU的OVS加速结构...................... 26 3.3.2测试系统................................. 27 3.3.3Benchmark................................ 27 3.4 SD-WAN网关卸载加速............................. 29 3.4.1基于DPU的SD-WAN加速结构.................... 30 3.4.2测试系统................................. 31 3.4.3Benchmark................................ 32 3.5 负载均衡LB卸载加速............................. 33 3.5.1基于DPU的LB加速结构....................... 33 3.5.2测试系统................................. 33 3.5.3Benchmark................................ 34 3.6 5GMEC...................................... 36 3.6.1基于DPU的5GMEC加速结构.................... 37 3.6.2测试系统................................. 38 3.6.3Benchmark................................ 39 第4章面向存储的基准评测41 4.1NVMe-oF加速41 4.1.1基于DPU的加速结构42 4.1.2测试系统44 4.1.3Benchmark45 第5章面向计算的基准评测49 5.1Spark加速49 5.1.1基于DPU的Spark加速结构50 5.1.2测试系统50 5.1.3Benchmark51 5.2AI加速52 5.2.1基于DPU的AI加速结构53 5.2.2测试系统................................. 54 5.2.3Benchmark................................ 54 5.3 数据库加速.................................... 57 5.3.1基于DPU的数据库加速结构..................... 57 5.3.2测试系统................................. 58 5.3.3Benchmark................................ 58 5.4 视频/图像编解码................................. 60 5.4.1基于DPU的视频/图像编解码加速结构................ 60 5.4.2测试系统................................. 61 5.4.3Benchmark................................ 62 5.5 云原生加速.................................... 65 5.5.1基于DPU的云原生加速结构..................... 65 5.5.2测试系统................................. 66 5.5.3Benchmark................................ 68 第6章 面向安全的基准评测 72 6.1 DPI........................................ 72 6.1.1基于DPU的DPI加速架构....................... 72 6.1.2测试系统................................. 73 6.1.3Benchmark................................ 74 6.2 防火墙...................................... 75 6.2.1基于DPU的防火墙加速架构..................... 75 6.2.2测试系统................................. 76 6.2.3Benchmark................................ 76 6.3 IPS/IDS...................................... 78 6.3.1 基于DPU的IPS/IDS加速架构.................... 78 6.3.2 测试系统................................. 78 6.3.3 Benchmark................................ 80 6.4IPSec ....................................... 81 6.4.1 基于DPU的IPSec加速结构...................... 81 6.4.2 测试系统................................. 82 6.4.3 Benchmark................................ 83 第7章 总结 85 附录A Benchmark汇总 86 附录B 测试工具 87 B.1 Netperf...................................... 87 B.2 Iperf3....................................... 87 B.3 Perftest...................................... 87 B.4 Perf........................................ 88 B.5 TPCBenchmarks................................. 88 B.6 FIO........................................ 88 B.7 Imagemagick................................... 88 B.8 ffmpeg....................................... 88 B.9 sockperf...................................... 89 B.10fortio89 B.11Ftester89 索引90 插图目录 1.1DPU功能集4 2.1单端型与端到端型测试系统模型10 2.2单端型测试系统组成12 2.3端到端型测试系统组成13 2.4多端型测试系统模型14 2.5多端型测试系统组成14 2.6测试执行16 3.1DPU加速基础网络的架构示意图18 3.2DPU基础网络加速能力端到端型测试系统19 3.3DPU基础网络加速多端型测试系统20 3.4DPURDMA实现内存资源池化场景示意图23 3.5DPU支撑RDMA应用的架构示意图23 3.6基于DPU的OVS加速结构27 3.7OVS测试系统28 3.8SD-WAN应用场景30 3.9SD-WAN网关节点部署31 3.10SD-WAN测试系统31 3.11基于DPU的LB加速结构34 3.12LB测试系统35 3.135GMEC中的DPU37 3.145GMECDPU加速结构图38 3.155GMECDPU测试组网38 4.1加速结构42 4.2NVMe-oF半卸载示意图43 4.3NVMe-oF全卸载示意图44 4.4测试系统44 DPUBenchmarkWhi