行业研究|深度报告 看好(维持) 数据中心、国产化浪潮和先进封装助力,算力芯片未来可期 电子行业 国家/地区中国 行业电子行业 报告发布日期2023年06月26日 核心观点 近日,英伟达宣布GH200GraceHopper超级芯片投产,全球AI服务器算力芯片市场迎来变革,中国芯片企业在面临挑战的同时,也有望在迎来发展机遇。 国产算力芯片市占率低,具备广阔拓展空间。算力芯片目前国产厂商份额极低。CPU目前从市场占有率来说,Intel依靠其强大的X86生态体系,在通用CPU市场占据领先地位,市场份额常年保持在80%左右,AMD近期追赶势头明显,其他厂商 整体市场份额不超过1%。2022年,数据中心领域Intel市场占有率为71%,较21年下降10pcts,AMD在22年市占率快速提升8pcts至20%,亚马逊、Ampere等新兴玩家份额快速提升,给总计份额不足5%的国产厂商发展带来了借鉴意义。在独立显卡市场上,NVIDIA、AMD和英特尔2022年Q4全球GPU市场占有率分别为82%、9%和9%。 多数参数我国CPU具备比肩能力,IPC性能是最主要差距。目前通过公开信息可以看出,主频、核心数、内存类型等指标我国CPU厂商差异不大,具备一定的比肩能力,但落实到具体性能决定指标IPC,仅Intel和AMD会公布IPC“相比上一代提升了多少”,其他国产CPU从IPC性能来看大致落后于Intel、AMD几年水平。 国产厂商的机遇一:数据中心带来新需求。根据工信部信息通信发展司数据,2017年我国数据中心市场总机架数量166万架,2022年预测达到670万架,2017-2022E复合增速达32.2%。目前东数西算工程将通过构建数据中心、云计算、大数 据一体化的新型算力网络体系,于2022年2月,在京津冀、长三角、粤港澳大湾区 等8地启动建设国家算力枢纽节点,规划了10个国家数据中心集群。各地数据中心 都将集聚大量服务器,如韶关数据中心预计到2025年将建成50万架标准机架、 500万台服务器规模,投资超500亿元(不含服务器及软件)。 国产厂商的机遇二:国产化浪潮。政府及国有企事业单位为国产CPU主阵地。据测算,今年PC芯片市场规模在162-330亿元之间,2022年服务器芯片市场规模则已 达130亿美元。在企业级市场中,也不仅是国有企业,能源、交通、金融、电信、教育等重要领域或规模较大的民营企业也存在设备国产化需求。消费级市场对产业生态的要求最高,对性价比较为敏感,迭代周期短,是国产CPU长期需突破的目标市场。 国产厂商的机遇三:通过封测技术弯道超车。后摩尔时代的到来,一方面,CPU制程进入后摩尔定律时期升级速度趋缓,国产CPU性能与国际主流水平逐步缩小,存 在赶超的可能;另一方面,先进封装技术成为兵家竞争新赛道,在封装方面,我国封测厂商长电科技和通富微电在全球前五中占据两席,通富与AMD紧密合作,先进封装技术正成为集成电路产业发展的新引擎,我国CPU企业有望通过封测技术弯道超车,弥补先进制程能力不足的缺陷。目前国产CPU已经可以通过先进封装技术实现性能提升与应用场景拓展。 投资建议与投资标的 AI算力、低功耗等对服务器算力芯片提出新的要求,英伟达GH200有望加速全球AI服务器算力芯片市场变革,中国芯片企业在面临挑战的同时,也有望迎来发展机遇。我们建议关注海光信息、寒武纪、龙芯中科、国芯科技、芯原股份、北京君正、通富微电、长电科技、深科技等。 风险提示 与头部厂商技术差距缩小不及预期、信创市场增长不及预期、产业链供应链保障不及预期、假设条件变化影响测算结果的风险。 证券分析师蒯剑 021-63325888*8514 kuaijian@orientsec.com.cn 执业证书编号:S0860514050005香港证监会牌照:BPT856 证券分析师李庭旭 litingxu@orientsec.com.cn 执业证书编号:S0860522090002 联系人杨宇轩 yangyuxuan@orientsec.com.cn 联系人韩潇锐 hanxiaorui@orientsec.com.cn 联系人张释文 zhangshiwen@orientsec.com.cn 联系人薛宏伟 xuehongwei@orientsec.com.cn 继续看好AI主线 2023-06-23 创新、复苏与国产化的共振:电子行业 2023-06-18 2023年中期策略报告VisionPro树行业标杆,有望开启XR行业 2023-06-08 “iPhone时刻” 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 目录 1算力芯片壁垒高、发展必要性强5 1.1不同算力芯片的特点与区别5 1.2CPU广泛应用于服务器、工作站、个人计算机等7 1.3GPU等AI芯片广泛应用于高性能运算、深度学习等场景9 2份额提升空间大,性能有待突破9 2.1国内厂商份额极低,具备广阔拓展空间9 2.2多数参数我国CPU具备比肩能力11 2.3国内厂商提升CPU性能的几大壁垒12 2.3.1指令级架构与生态绑定多年,创新面临知识产权等多重壁垒12 2.3.2EDA工具软件基本被垄断,软件工具集群被卡脖子14 2.3.3材料、设备、晶圆厂国产化率低,在诸多限制下提升困难14 2.4AI芯片的关键性能差异15 2.4.1AI芯片的关键特征包含数据特点、计算范式、精度、重构能力等15 2.4.2AI芯片设计趋势15 3国产厂商的机遇:数据中心、国产化和先进封装16 3.1数据中心快速发展带来行业新机遇16 3.2在国产化浪潮中不断突破不同市场16 3.3先进封装助力国产CPU企业弯道超车18 4投资建议18 4.1海光信息:国产服务器算力芯片龙头18 4.2寒武纪:领跑中国AI芯片市场20 4.3龙芯中科:从指令集到架构全自主的CPU22 5风险提示25 6附录非上市算力芯片公司25 6.1华为:布局五大系列芯片,鲲鹏、昇腾满足服务器和AI需求25 6.2飞腾:从CPU研发到全栈式方案28 6.3兆芯:行业拓展成果显著31 6.4申威:以自研指令集保障关键领域34 图表目录 图1:Inteli76700KSOC结构示意图6 图2:CPU与GPU内部构造对比6 图3:FPGA并行运算相对CPU可提升视觉算法计算效率7 图4:IBM的TrueNorth芯片结构、功能、物理形态图9 图5:2021年全球数据中心CPU市场份额10 图6:2021-2022年全球数据中心CPU市场份额10 图7:4Q22全球GPU市场占有率11 图8:4Q22全球独立GPU市场占有率11 图9:我国数据中心机架规模16 图10:CPU三类市场划分及特点17 图11:龙芯中科3D5000芯片18 图12:3D5000芯片由2颗3C5000芯片封装而成18 图13:海光信息公司及产品发展沿革19 图14:全算力的产品布局21 图15:车云协同助力数据闭环与AI调优21 图16:云边端车协同21 图17:训练软件平台22 图18:推理加速引擎MagicMind22 图19:龙芯中科股权结构(截至2023.4.28)23 图20:公司龙芯自主指令系统24 图21:龙架构及其特性24 图22:龙芯3D5000规格参数24 图23:龙芯CPU系列及其应用25 图24:华为五大系列芯片全景图26 图25:IDC预测2023年全球计算产业投资额27 图26:华为鲲鹏计算产业定位与展望27 图27:华为5大关键芯片演进策略27 图28:基于飞腾平台的终端全栈架构30 图29:兆芯芯片产品应用图谱33 图30:申威2601035 图31:申威CPU基本特征35 图32:“神威·太湖之光”外观36 表1:CPU,GPU,FPG与ASIC的特性与功能5 表2:独立GPU与集成GPU比较6 表3:CPU的下游应用分类7 表4:国内外主流厂商服务器CPU性能对比12 表5:不同指令集架构对比分析12 表6:PC芯片市场规模测算17 表7:2022年中国服务器芯片市场规模17 表8:海光系列CPU特性及应用19 表9:海光DPU规格特点20 表10:寒武纪产品行业解决方案示例22 表11:鲲鹏920处理器产品特性26 表12:各行业数字化转型需求28 表13:飞腾公司发展沿革28 表14:飞腾CPU产品分类及定位29 表15:飞腾三大产品系列发展路线及应用30 表16:兆芯公司发展沿革31 表17:兆芯处理器芯片家族32 表18:兆芯行业拓展成果34 表19:申威产品特性及应用35 1算力芯片壁垒高、发展必要性强 英伟达宣布生成式AI引擎NVIDIADGXGH200现已投入量产。2023年5月28日,英伟达创始人兼CEO黄仁勋在NVIDIAComputex2023演讲中宣布,生成式AI引擎NVIDIADGXGH200现已投入量产。GH200使用Nvidia的NVLink-C2C互连技术,将Nvidia基于ARM的GraceCPU和HopperGPU架构融合到一个芯片中。NVIDIADGXGH200将256个NVIDIAGraceHopper超级芯片完全连接到单个GPU中,支持万亿参数AI大模型训练,能够处理大规模推荐系统、生成式人工智能和图形分析,并为巨型人工智能模型提供线性可扩展性。Nvidia的服务器合作伙伴正计划基于新的GH200Superchip打造他们自己的系统,首批产品将于今年晚些时候上市。 GH200速度和功耗指标都有显著提升。这款新的芯片总带宽达每秒900GB,比当今最先进的加速计算系统中采用的标准PCIeGen5通道高出7倍。Nvidia表示,Superchip的功耗也降低了5 倍,使其能够更有效地处理那些要求苛刻的AI和高性能计算应用。 AMD推出数据中心APUInstinctMI300。北京时间2023年6月14日凌晨,AMD推出数据中心APU(加速处理器)InstinctMI300,其旨在帮助数据中心处理人工智能相关数据流量,并在这一快速增长的市场上挑战英伟达的垄断地位。InstinctMI300系列将包括一个GPU(图形处理器)MI300X,可以加速ChatGPT等聊天机器人所使用的生成式AI技术的处理。 先进算力国产替代在行业变革中有望迎来机遇。半导体国产化势在必行,而算力芯片又是重中之重。AI算力、低功耗等对服务器算力芯片提出新的要求,市场格局近几个季度变化较多,英伟达GH200有望加速全球AI服务器算力芯片市场变革,中国芯片企业在面临挑战的同时,也有望迎来发展机遇。 1.1不同算力芯片的特点与区别 计算芯片包括CPU、GPU、FPGA、ASIC等,都用作计算分析。其中,CPU是性能最综合的计算芯片,AI算法的执行也运用GPU、FPGA、ASIC等芯片。 表1:CPU,GPU,FPG与ASIC的特性与功能 指标 CPU GPU FPGA ASIC 架构区别峰值算力 70%晶体管用来构建Cache,还有一部分控制单元,计算单元少,适用于运算复杂,逻辑复杂的计算。 一般 晶体管大部分构建计算单元,运算复杂度低,适合大规模并行计算。 较高 可编程逻辑,不通过指令集,计算效率高,更接近底层IO,通过几余晶体管和连线实现逻辑可编程。 较高 晶体管根据算法定制,不会有冗余,功耗低、计算性能高、计算效率高。定制开发成本高,时间周期长。 最高 功耗 高 高 较低 最低 能耗比 最低 较低 较高 最高 通用性时延 最高微秒级别 较高1毫秒 一般1微秒 最低1微秒 数据来源:中国信通院,凡亿教育,AI电堂,东方证券研究所 CPU是综合计算芯片,擅长逻辑控制和串行运算。计算机的运算器和控制器一起组成了CPU,CPU是整台计算机的大脑,也是一个有多种功能的优秀领导者。它的优点在于调度、管理、协调 能力强,计算能力则位于其次。CPU有大量