AMD 1-Socket Server: Scaling Performance Efficiency
概述
AMD与Meta合作开发了基于AMD SP3插座的1-socket服务器(North Dome),旨在优化性能效率。该平台采用可定制的CPU SKU设计,支持高性能计算、加速器或闪存配置的模块化平台。
关键特性
- 处理器:基于AMD SP3插座的第三代EPYC™“Zen3”架构处理器,提供3rdGen EPYC™兼容性。
- 内存:六通道DDR4,最高3200MT/s,支持两个2280 NVMex4和一个22110 NVMex4 SSD。
- 扩展性:29个PCIe插槽(x16 + x8 + x4 + x1)、一个USB 2.0接口、一对I2C、一对UART。
性能与能效
- EPYC™“Zen 3”架构:相较于“Zen 2”,降低延迟,显著提升HPC和云应用加速能力。
- 核心复杂度与缓存:8个直接访问L3缓存,优化大型虚拟机性能。
- IPC提升:双核复杂度提升2倍,SPECrate® 2017性能在相同功率下提升19%。
- AI推理:AI推理吞吐量翻倍,INT8管道提速,浮点运算更快。
架构与规模
- 芯片级架构:通过“Zen 3”架构实现广泛扩展,最高支持64c @ 280W,以高性能和吞吐量满足Meta挑战。
- 最佳能效:95W下的最佳能效,每个线程有足够的性能以满足延迟需求。
合作与优化
- 联合投资与优化:平台设计优化了功率效率,对Facebook进行了功率管理算法的调整,并在板级上优化了功耗。
- 工具链增强:提高了性能,通过OS和BIOS级别的优化进一步提升了性能。
- 工作负载优化:针对Facebook工作负载的优化,重点关注AI/ML、web tier和数据库领域。
行动呼吁
- 规格贡献:当前正在制定详细的规格,并在服务器wiki上提供了草案版本。
- ODM协作:设计资料将由ODM团队贡献。
- 低功耗优化:新芯片架构的多个自定义设置使性能/瓦特比得到优化。
- 参与机会:邀请加入,共同提高数据中心服务器的性能、能效和成本效率。
资源链接