研究目的&摘要 摘要 研究目的 —— 指令集应用分布情况:目前CPU行业由两大生态体系主导:一是基于X86指令系统和Windows操作系统的Wintel体系,主要用于服务器与电脑等;二是基于ARM指令系统和Android操作系统的AA体系,主要用于移动设备。在Wintel体系中,CPU厂商生产芯片,操作系统厂商提供操作系统;在AA体系中,CPU厂商对芯片或系统厂商进行指令系统或IP核授权,操作系统厂商提供基础版操作系统,由整机厂商定制专用芯片和发行版操作系统。 本报告为中国服务器CPU行业概览,本报告将深度梳理中国服务器CPU的技术路线、产业链、市场规模及竞争情况。 研究区域范围:中国地区 市场规模:根据测算,2022年中国服务器CPU行业市场规模从2018年的1,005.9亿元人民币增长至2023年的1,900.5亿元人民币,2018-2023年的年均复合增长率为13.6%。2024年中国服务器CPU行业市场规模为2,111.0亿元人民币,预计在2028年以14.5%的年均复合增长率成长至3,628.3亿元人民币。我们认为中国数据中心行业快速发展与信创带动高单价国产CPU应用两个因素驱动。 研究对象:服务器CPU行业 此研究将会回答的关键问题: ①服务器CPU指令集应用分布情况如何? ②服务器CPU市场规模如何? 竞争格局:性能方面:在性能方面,海光系列的X86架构和鲲鹏系列的ARM架构占据优势。生态方面:海光和兆芯基于X86指令集,具备生态优势。飞腾和鲲鹏等以ARM架构为代表的厂商正在构建自己的生态系统。申威和龙芯由于采用自研指令集,生态扩展上相对不具备明显的优势。指令集自主可控:申威和龙芯通过自研指令集实现自主可控,处于领先地位。鲲鹏和飞腾等基于ARM的指令集,虽然具备授权,但相对于自研指令集在自主可控性上稍显不足。海光和兆芯基于X86的IP授权,自主性较低。 ③服务器CPU竞争情况如何? 400400--072072--55885588 定义与分类 中央处理器(Central Processing Unit,简称CPU)作为计算机系统的运算和控制核心,是信息处理、程序运行的最终执行单元。 CPU与GPU的组成结构与运算方式存在不同。CPU作为电脑的中央处理器,其运行主要以串行计算的方式进行。串行计算指的是多个程序在同一个处理器上被执行,只有在当前的程序执行结束后,下一个程序才能开始执行。而GPU是电脑的图形处理器,最初主要用于图像运算,适用于加速计算场景中实现并行计算的需要。二者组成的不同主要表现在,CPU拥有更大的逻辑运算单元和控制单元,同时拥有更大的缓存空间,但GPU却拥有更多的逻辑运算单元数量。 CPU主要由计算单元(ALU)、控制单元(CU)、寄存器(Register)、高速缓存器(Cache)和它们之间的连接总线构成。控制单元负责协调并控制计算机各部件执行程序的指令序列,基本功能包括取指令、分析指令和执行指令。计算单元则负责根据控制器的命令执行计算机的算术运算、位移等操作以及地址的运算和转换。寄存器则负责计算过程中临时数据的存储。 对比项 CPU GPU CPU设计注重通用性和灵活性,适合处理复杂的、串行的计算任务 GPU设计重点在于处理大量的并行任务,适合执行重复且简单的操作 设计理念 内存 CPU CPU通常包含较少的核心,但每个核心能够处理复杂任务和多任务并发 GPU包含成百上千的小核心,每个核心专注于执行单一任务,但在并行处理大量数据时 进程 控制单元 核心结构 指令地址 指令计数器 表现卓越 指令1指令2…. 代码段 在执行逻辑复杂、依赖于单线程性能的任务时,CPU通常表现更优 GPU在处理可以并行化的大规模数据时,如图像处理、科学计算,表现出远超CPU的处 指令寄存器 指令 处理速度 理速度 控制指令 指令n 在单线程任务中,CPU提供更高的能效比 当任务可以并行化时,GPU在能效比上通常更有优势,尤其是在大规模计算任务中 能效比 操作数地址 数据1数据2…数据n 数据段 复杂逻辑处理:适合处理需要复杂决策树和分支预测的任务,如数据库查询、服务器应 储存单元 运算单元 数据并行处理:需要同时处理大量数据的场景下,如深度学习、大规模图像或视频处理 数据 用等 优势场景 高吞 数据 单线程性能要求高的任务:在需要强大单线程性能的应用中,如某些类型的游戏或应用 吐量计算任务:适用于需要高吞吐量计算的应用,如科学模拟、天气预测等 程序 CPU指令集分类(1/3) CPU指令集主要分为复杂指令集与精简指令集,复杂指令集方面,X86架构占据主导地位;精简指令集方面,ARM架构占据主导地位 CPU指令集分类 复杂指令集与精简指令集对比 目前CPU行业由两大生态体系主导:一是基于X86指令系统和Windows操作系统的Wintel体系,主要用于服务器与电脑等;二是基于ARM指令系统和Android操作系统的AA体系,主要用于移动设备。 优点 缺点 主要应用领域 代表 指令丰富,功能强大寻址方式灵活 指令使用率不均衡 不利于采用先进结构提高性能 复杂指令集 以微程序控制器为核心,性能强大 桌面,服务器 X86 在Wintel体系中,CPU厂商生产芯片,操作系统厂商提供操作系统; 结构复杂不利于实现VLSI(超大规模集成电路) 指令数较少,功能不及CISC强大 在AA体系中,CPU厂商对芯片或系统厂商进行指令系统或IP核授权,操作系统厂商提供基础版操作系统,由整机厂商定制专用芯片和发行版操作系统。 结构简单、易于设计指令精简,使用率均衡程序执行效率高 在并行处理方面更优 ARM、MIPS、POWER、RISC-V 移动端、车载、PC和服务器等 精简指令集 寻址方式不够灵活 指令集厂商 国际芯片厂商 国产芯片厂商 ARM架构占RISC约90%份额 ARM架构 ARM ARM、高通、三星、苹果 飞腾、华为、展讯 MIPS架构 Imagination MIPS 龙芯、北京君正 精简指令集RISC RISC-V架构 Microsemi 平头哥(阿里)、华米 CPU指令集 Alpha架构 / 申威 X86架构占CISC约90%份额 PowerPC架构 IBM IBM 苏州国芯 复杂指令集CISC Intel Intel、AMD 海光、兆芯 X86架构 CPU指令集分类(2/3) X86架构深耕服务器市场,已经在软硬件开发上建立了一套统一标准,且性能水平更优异,但ARM成本生态较好且功耗更低 主要指令集对比 两大主流架构对比:X86 vs. ARM 应用范围:X86架构长期主导个人电脑操作系统领域近三十年,已经在软硬件开发上建立了一套统一标准。相对而言,ARM架构主要应用于移动终端,尤其在Android系统下形成了一个开源生态系统。在国产化过程中,以鲲鹏为代表的ARM架构开始向服务器领域拓展。 指令集 CPU类别 优势 劣势 主要应用场景 功耗高,芯片面积大,价格 高性能、兼容性好 软件生态完善,服务器领域市占率高 昂贵 CISC X86 PC、服务器 指令集架构后向兼容历史包袱重,实现复杂 ARM公司本身并不依靠自有设计制造或销售CPU,而是将其处理器架构授权给有兴趣的厂家,主要的合作伙伴包括苹果、Google、Ampere、Marvell、华为、三星、高通等。 高性能,追求极致可靠性(RAS),在大型机领域独具优势 大型机、高端服务器等 POWER 服务器价格昂贵,生态较弱 64位计算:X86最初采用32位指令集,后来采用了AMD开发的64位指令集。相较之下,ARM基于其原有原则和架构开发了简洁的64位架构,ARMV8引入了两种执行模式,即AArch32和AArch64。处理器在运行中能够在这两种模式之间无缝切换。 体积小、低功耗、低成本、 在PC和服务器端弱于X86较为封闭,不得改变原有设计,服务器软件生态弱于X86 高性能 移动端、车载、PC和服务器等 ARM 生态较好,授权模式早,配套IP完善 指令执行速度快 完全开源、架构简单、易于移植Linix系统、模块化设计,允许衍生设计和开发闭源 相互兼容性:此外,几乎所有ARM系统都采用Linux操作系统,但由于硬件系统几乎都需要独立构建,这使得它们与其他系统不太兼容。这也导致了应用软件难以方便地移植,严重制约了ARM系统的发展和应用。 诞生时间短,编译器、开发工具和软件开发环境以及其 物联网(IoT)、高性能计算等 RISC RISC-V 他生态还在发展 对标Intel但性能和功耗无明显优势 功耗与性能:ARM的性能提升有一定限制。面对云计算基础设施,其NeoverseN1系列处理器在 7nm 工艺下的主频仅能达到2.6-3.1GHz,远低于Power和x86的性能水平。ARM的优势在于低功耗,若要提升性能,则需以功耗为代价。在高性能场景,需要采用乱序执行来提高处理能力,而ARM的指令集主要侧重于顺序执行,并且依赖于多核而非单核多线程来执行。 在学界影响广泛 早期性能超过ARM且功耗低于ARM 授权方式单一,费用高于ARM,软件生态较差 商业化进程落后,单内核无法承受高容量内存配置,并行线程的技术方向不是未来 工控、PC和通信等 MIPS 简洁、优化、具备高可拓展 性 主流 市场规模(3/3) 2024年中国服务器CPU行业市场规模为2,111.0亿元人民币,市场增长主要受中国数据中心行业快速发展与信创带动高单价国产CPU应用两个因素驱动 中国服务器CPU行业市场规模,2018-2028E 单位:[亿元人民币] 根据测算,2022年中国服务器CPU行业市场规模从2018年的1,005.9亿元人民币增长至2023年的1,900.5亿元人民币,2018-2023年的年均复合增长率为13.6%。2024年中国服务器CPU行业市场规模为2,111.0亿元人民币,预计在2028年以14.5%的年均复合增长率成长至3,628.3亿元人民币。我们认为中国数据中心行业快速发展与信创带动高单价国产CPU应用两个因素驱动。 东数西算规划IDC集群,后续建设拉动服务器采购需求。2022年2月,国家发改委等部门联合印发文件,同意在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏等8地启动建设国家算力枢纽节点,并规划了10个国家数据中心集群,“东数西算”工程正式全面启动,带动服务器采购需求,同时拉动对服务器CPU需求的增长。 国产服务器CPU价格较国外厂商产品的价格高出近一倍,且在短期内服务器CPU厂商降价意愿不高,预计在信创推动服务器CPU国产化应用的过程当中,将相应推动市场规模的增长。 竞争格局(1/3) 性能方面,海光系列的X86架构和鲲鹏系列的ARM架构占据优势;生态方面海光和兆芯基于X86指令集,具备生态优势;自主可控方面,申威和龙芯通过自研指令集处于领先地位 国产CPU竞争格局 性能方面:在性能方面,海光系列的X86架构和鲲鹏系列的ARM架构占据优势。 生态方面:海光和兆芯基于X86指令集,具备生态优势。飞腾和鲲鹏等以ARM架构为代表的厂商正在构建自己的生态系统。申威和龙芯由于采用自研指令集,生态扩展上相对不具备明显的优势。 指令集自主可控:申威和龙芯通过自研指令集实现自主可控,处于领先地位。鲲鹏和飞腾等基于ARM的指令集,虽然具备授权,但相对于自研指令集在自主可控性上稍显不足。海光和兆芯基于X86的IP授权,自主性较低。 海光 AMD/中科曙光 兆芯 龙芯 中科院研究所 飞腾 天津飞腾/CEC ARM前景广阔,产品线 鲲鹏华为 申威 合作方 VIA/上海国资委 江南计算所/CETC ARM前景广