热门搜索：

AI系列报告之接口：AI大算力需求加速新技术渗透

电子设备2023-04-18蒯剑、李庭旭东方证券小***

AI智能总结

总结如下：

该研报聚焦于AI领域的发展趋势，特别是AI模型数据量和算力需求的激增对服务器、内存技术以及相关接口芯片的影响。报告指出，AI模型如ChatGPT在数据存储和算力需求上呈现指数级增长，这推动了AI服务器市场的快速增长，预计2023年出货量增长率可达8%，并在2022-2026年间保持10.8%的复合年增长率。

随着AI服务器需求的增加，内存技术如DDR5、HBM、CXL和NVLink等正加速渗透，以满足高性能计算的需求。DDR5内存接口芯片的需求量和价格预计将随着服务器性能的提升而增长。HBM内存芯片因其高带宽特性，被认为是支撑大算力芯片的关键技术，预计2023-2025年的复合年增长率将超过40%。CXL技术则提供了一种高速且低延迟的互联方式，预计市场规模将在2025年达到20亿美元，到2030年可能超过200亿美元。

报告还提到，NVLink技术能够显著提升系统吞吐量，支持高性能计算任务，例如AI训练和HPC应用。此外，澜起科技、聚辰股份、裕太微和龙迅股份等公司因其在内存接口芯片、PCIe接口和高速信号传输方面的技术优势，被推荐关注。

报告还包含了一系列风险提示，包括服务器需求拉动不足、新技术渗透率低于预期的风险。最后，给出了投资建议，看好服务器带来的接口芯片技术升级趋势，并推荐关注上述四家公司。

行业研究|动态跟踪看好（维持） AI系列报告之接口：AI大算力需求加速新技术渗透电子行业国家/地区中国行业电子行业报告发布日期2023年04月18日核心观点 AI模型数据量和算力需求大。ChatGPT3相较ChatGPT2在数据存储端从百G提升至40T，在存储量上有约100倍的提升，算力需求同样也呈几何倍增长。据OpenAI 测算，2012年以来全球头部AI模型训练算力需求3-4个月翻一番，每年头部训练模型所需算力增长幅度高达10倍，远超摩尔定律的增长速度。美光表示，一个典型的人工智能服务器的DRAM容量是普通服务器的8倍，NAND容量是普通服务器的3倍。 AI服务器快速增长，内存技术同步升级。根据TrendForce，预计2022年搭载 GPGPU的AI服务器年出货量占整体服务器比重近1%，而2023年ChatGPT相关应用有望再度刺激AI相关领域，预计2023年出货量增长率可达8%，2022-2026年复合成长率将达10.8%。为提升服务器性能，AI服务器需搭载多个CPU处理器，同时服务器CPU性能不断升级，要求内存技术同步升级。DDR5、HBM、 CXL、NVLink等内存技术将加速渗透，有望充分受益于AI带来的算力需求增长。 DDR5需要使用更多内存接口芯片。DDR5的内存接口缓存芯片RCD价格远高于 DDR4，内存接口芯片有望迎来量价齐升。DDR5芯片需要搭载更多的SPD、电源管理芯片（PMIC）和温度传感器（TS）等配套芯片。 HBM为大算力芯片提供支撑。如今搭载于新兴AI应用的内存芯片亟待升级，而 HBM是一种基于3D堆叠工艺的DRAM内存芯片，被安装在GPU、网络交换设备、AI加速器及高效能服务器上。HBM作为一种带宽远超DDR/GDDR的高速内存，将为大算力芯片提供能力支撑，同时生成类模型也会加速HBM内存进一步增大容量和增大带宽。TrendForce预估2023-2025年HBM市场年复合成长率有望成长至40-45%以上。 CXL兼容性强、可实现内存一致性。CXL为英特尔于2019年推出的一种开放性互联协议，能够让CPU与GPU、FPGA或其他加速器之间实现高速高效的互联，从而满足高性能异构计算的要求。在AMD、ARM、IBM以及英特尔等主要CPU供应商的支持下，CXL已经成为领先的行业标准。美光科技在22年5月与投资者交流时曾预测CXL相关产品的市场规模，到2025年预计将达到20亿美金，到2030年可能超过200亿美金。 NVLink可最大化提升系统吞吐量。第四代NVIDIA®NVLink®技术可为多GPU系统配置提供高于以往1.5倍的带宽，以及增强的可扩展性。单个NVIDIAH100Tensor CoreGPU支持多达18个NVLink连接，总带宽为900GB/s，是PCIe5.0带宽的7倍。第三代NVIDIANVSwitch™基于NVLink的高级通信能力构建，可为计算密集型工作负载提供更高带宽和更低延迟。NVIDIADGX™H100等服务器可利用NVLink技术来提高可扩展性，进而实现超快速的深度学习训练。投资建议与投资标的 我们看好服务器带来的接口芯片技术升级趋势，建议关注澜起科技、聚辰股份、裕太微、龙迅股份。风险提示 服务器需求拉动不及预期、新技术渗透率不及预期。蒯剑021-63325888*8514 kuaijian@orientsec.com.cn 执业证书编号：S0860514050005香港证监会牌照：BPT856 李庭旭litingxu@orientsec.com.cn 执业证书编号：S0860522090002 杨宇轩yangyuxuan@orientsec.com.cn韩潇锐hanxiaorui@orientsec.com.cn张释文zhangshiwen@orientsec.com.cn薛宏伟xuehongwei@orientsec.com.cn 大模型增加存储需求，行业景气底部反暖2023-04-17 AI系列报告之PCB：AI算力需求增长，服2023-04-07 务器PCB厂商受益算力需求提升，光芯片正扬帆2023-03-26 有关分析师的申明，见本报告最后部分。其他重要信息披露见分析师申明之后部分，或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 AI大算力需求加速新技术渗透 AI模型数据量和算力需求大。ChatGPT3相较ChatGPT2在数据存储端从百G提升至40T，在存储量上有约100倍的提升，算力需求同样也呈几何倍增长。据OpenAI测算，2012年以来全球头部AI模型训练算力需求3-4个月翻一番，每年头部训练模型所需算力增长幅度高达10倍，远超摩尔定律的增长速度。随着算力的不断进步，所需存储的数据量在以指数级的增长速度攀升。得益于人工智能、物联网、云计算、边缘计算等新兴技术在中国的快速发展，中国数据圈正在迎来快速增长。据此前IDC预测，预计到2025年，中国数据圈将增长至48.6ZB，占全球数据圈的27.8%，成为全球最大的数据圈。美光首席商务官萨达纳表示，一个典型的人工智能服务器的DRAM容量是普通服务器的8倍，NAND容量是普通服务器的3倍。图1：2017-2021我国存储容量增量（EB）图2：2017-2023E中国数据存储市场规模及增速 350 300 250 200 150 100 50 0 存储容量增量（EB） 10000 8000 6000 4000 2000 0 3494 4624 市场规模（亿元）YoY 32% 7000 527054345983 14% 10% 3% 8500 17% 35% 30% 25% 21%20% 15% 10% 5% 0% 20172018201920202021 201720182019202020212022E2023E 数据来源：中国信通院、东方证券研究所数据来源：观研报告网、东方证券研究所 AI服务器快速增长，内存技术同步升级。根据TrendForce，在自动驾驶汽车、AIoT与边缘运算等新兴应用的带领下，自2018年起诸多大型云端业者开始大量投入AI相关的设备建设，预计2022年搭载GPGPU的AI服务器年出货量占整体服务器比重近1%，而2023年ChatGPT相关应用有望再度刺激AI相关领域，预计2023年出货量增长率可达8%，2022-2026年复合成长率将达10.8%。内存接口芯片是高端服务器中CPU与内存之间进行数据传输的核心部件，其主要作用是提升高速内存数据访问的速度及稳定性，满足服务器CPU对内存模组日益增长的高性能及大容量需求。为提升服务器性能，AI服务器需搭载多个CPU和GPU处理器，同时服务器CPU性能不断升级，要求内存技术同步升级。DDR5、HBM、CXL、NVLink等内存技术将加速渗透，有望充分受益于AI带来的算力需求增长。图3：2022-2023E全球AI服务器出货量（千台）图4：不同类型服务器成本构成 250 200 150 100 全球AI服务器出货量（千台） 20222023E2024E2025E2026E 100% 80% 60% 40% 20% 0% CPUGPU内存硬盘其他 20-25% 2-5% 5-10% 5-10% 15-20% 25-30% 25-30% 27-30% 70-75% 30-35% 20-25% 5-10% 20-25% 基础型高性能型机器学习型数据来源：TrendForce、东方证券研究所数据来源：行行查研究中心、东方证券研究所表1：服务器型号对比浪潮普通服务器浪潮AI服务器英伟达AI服务器英伟达AI服务器服务器型号 NF5280M6 NF5688M6 DGXA100 DGXH100 CPU型号英特尔第三代Xeon处理器英特尔第三代Xeon处理器 AMD第二代Epyc处理器Rome7742 英特尔第四代Xeon处理器SapphireRapids CPU数量 1-2 2 2 2 CPUDDR 最大支持32根内存条，支持RDIMM类型支持32条DDR4RDIMM/LRDIMM内存 2TB 2TB GPU型号 / NVIDIAA800 A100TensorCore H100TensorCore GPU数量 / 8 8 8 GPU内存 / 每个对应HBM2e 80GB 每个对应HBM2e 80GB 每个对应HBM2e 80GB 硬盘NAND 最大支持20块3.5英寸硬盘或39块2.5英寸硬盘 8块2.5英寸NVMeSSD/16块2.5英寸SATA/SASSSD 操作系统：2个1.92TBNVMeM.2驱动器内部存储：8个3.84TBNVMeU.2驱动器操作系统：2块1.9TBNVMeM.2硬盘内部存储：8块3.84TBNVMeU.2硬盘数据来源：浪潮信息官网、英伟达官网、东方证券研究所 DDR5对比DDR4性能全面提升，需要使用更多内存接口芯片。1）性能：DDR5内存频率从3200MHz起跳（一般都会在4800MHz以上）、最高可达8400MHz；2）核心容量密度：SK海力士给出8Gb、16Gb、24Gb、32Gb、64Gb丰富的选择，DDR5单条内存最大可到128GB；3）功耗：DDR5支持1.1V电压，进一步降低了功耗。另外，DDR5搭载DQS间隔振荡器，具备错误检查与清理能力，具备更强的抵抗环境变化的能力和更强的可靠性。DDR5性能全面提升，要求新一代内存接口芯片支持高速、低功耗、系统扩展等要求。DDR5模组需要搭载SPD、电源管理芯片（PMIC）和温度传感器（TS）等配套芯片。此外，在LRDIMM模组中，相比DDR3只采用1颗寄存缓存芯片、DDR4最多采用“1+9”个内存芯片，DDR5对内存接口的需求进一步提升，最多达到“1+10”个（1RCD+10DB），内存接口芯片有望迎来量价齐升。表2：内存接口芯片随着内存升级使用量增加接口协议标准内存模组内存接口芯片内存模组配套芯片 DDR2 FBDIMM AMB DDR3 RDIMM 1RCD 1TS LRDIMM 1MB 1TS DDR4 RDIMM 1RCD 1TS LRDIMM 9DB、1RCD 1TS DDR5 RDIMM 1RCD 1SPD、2TS、1PMIC LRDIMM 10DB、1RCD 1SPD、2TS、1PMIC 数据来源：澜起科技官网、IDT、东方证券研究所 HBM为大算力芯片提供支撑。ChatGPT依赖更高算力，且更多是趋向于矩阵类和卷积类的计算，其对内存的需求也体现在训练和推理AI芯片，或是加速模块里的内存带宽，而HBM是一种基于3D堆叠工艺的DRAM内存芯片，被安装在GPU、网络交换设备、AI加速器及高效能服务器上。 HBM能大幅提高数据处理速度，每瓦带宽比GDDR5高出3倍还多，且HBM比GDDR5节省了94%的表面积。HBM作为一种带宽远超DDR/GDDR的高速内存，将为大算力芯片提供能力支撑，同时生成类模型也会加速HBM内存进一步增大容量和增大带宽。TrendForce预估2023-2025年HBM市场年复合成长率有望成长至40-45%以上。图5：HBM的立体结构图6：HBM与GDDR5对比数据来源：AMD、东方证券研究所数据来源：AMD、东方证券研究所 CXL兼容性强、可实现内存一致性。CXL全称为ComputeExpressLink，是由英特尔于2019年3月在InterconnectDay2019上推出的一种开放性互联协议，能够让CPU与GPU、FPGA或其他加速器之间实现高速高效的互联，从而满足高性能异构计算的要求。在AMD、ARM、IBM以及英特尔四个主要CPU相关供应商的支持下，CXL已经成为领先的行业标准。CXL构建于PCI-e逻辑和物理层级之上，所以其兼容性很高，更容易被现有支持PCI-e端口的处理器（绝大部分的通

点击免费查看完整报告