中泰证券研究所专业|领先|深度|诚信 |证券研究报告| 再踏层峰辟新天,拥抱算力新机遇 AI产业研究 算力系列之一:服务器/整机 2023.12.27 分析师:苏仪 执业证书编号:S0740520060001Email:suyi@zts.com.cn 联系人:刘一哲 Email:liuyz03@zts.com.cn 联系人:王雪晴 Email:wangxq@zts.com.cn 摘要 从总体发展趋势来看,各国密集出台大模型相关政策,数据、算力、算法更新迭代步伐加快,共同驱动AI大模型性能提升,AI大模型走出“闭源”和“开源”两种发展路径,各类企业和机构纷纷入局。我们将AI产业链分为基础层、工具层、模型层和应用层。AI大模型对算力需求指数级增长,高性能算力是AI大模型发展加速器。高质量的数据、算法、算力将引领新一轮发展热潮。 •当前我国算力规模稳步扩张,算力市场蓬勃发展。2022年我国计算设备算力总规模达到302EFlops,全球占比约为33%,连续两年增速超过50%,高于全球增速。 •中国服务器市场高速发展,竞争格局多样化,龙头效应显著。 •数据量、算法模型与AIGC三重因素驱动算力需求激增,政策端也在持续加码,共同推进算力需求持续落地。 AI服务器应用场景广泛,下游客户主要集中在互联网及运营商。 展望未来,随着AIGC、云计算技术及应用模式的进一步拓展,超级计算的需求及应用场景持续增长,超算+云计算带来服务器新增长。而超算所需要的高端服务器有望拉动服务器市场进一步增长。 风险提示:核心元器件生产/购买受制裁的风险;AI进展不及预期带来下游需求不及预期的风险;市场竞争加剧的风险; 研究报告中使用的公开资料可能存在信息滞后或更新不及时的风险等。 AI产业链一览 目录 CONTENTSONTE 中泰所 |领先|深度 1算力&服务器发展正当时 让算力早日像水和电一样即取即用,全国算力网络全面布局 算力:以计算能力为核心,包含算力规模、经济效益和供需情况在内的综合能力。 算力成为公共基础资源势在必行,“算力无所不在”离不开算力网络的支撑。 •随着数字经济时代全面开启,算力正在以新的生产力形式赋能千行百业,为经济社会高质量发展提供更有力支撑。然而,智能算力需求的爆发式增长使高性能算力稀缺,当前算力仍存在应用边际效益高、用不起、用不上的问题。未来,算力需求将提升,行业发展将持续保持高景气度。 •我国算力布局正处于连点成线、密织成网的阶段。我国持续优化基础设施建设,着力打造数据中心集群,相继启动东数西算工程、国家超算互联网建设,连接全国各地算力资源形成统一调度的全国一体化算力网络,使算力像水、电一样成为“一点接入、即取即用”的公共基础资源,在各类数字化要素的协同中实现更大价值。 图表:东数西算工程规模布局图表:算力成为一个公共服务 算力规模稳步扩张,算力市场蓬勃发展 全球数字经济持续提速,算力产业蓬勃发展。2022年全球计算设备算力总规模达到906EFlops,增速达到47%。算力产业蓬勃发展,预计未来五年全球算力规模将以超过50%的速度增长,到2025年全球计算设备算力总规模将超过3ZFlops。 我国算力规模和供给水平持续增长,融合应用深度不断拓展,行业赋能效益日益显现。经信通院测算,2022年我国计算设备算力总规模达到302EFlops,全球占比约为33%,连续两年增速超过50%,高于全球增速。智能算力需求呈现爆发式增长态势,在算力规模中的比重将越来越高,未来五年复合增长率达52.3%。 图表:全球算力规模与增速 图表:全球和我国算力规模与GDP、数字经济规模关系 1000 900 800 700 600 500 400 300 200 100 0 全球算力规模(EFlops)增速 90647.3% 43.4% 38.8% 615 429 309 2019202020212022 50% 45% 40% 35% 30% 25% 20% 15% 10% 5% 0% 服务器市场整体情况及竞争格局 中国服务器市场高速发展。据IDC数据显示,2022年中国服务器市场规模约为273亿美元,同比增长9.1%。2022年中国服务器市场销售量达447.8万台,同比增长12.7%。 •受AI需求暴涨,全球整机支出向AI服务器倾斜,通用服务器市场被进一步压缩。未来,随着产业智能化转型提速、高 算力基础设施升级和应用场景商业化发展,各大厂商将持续加码布局AI大模型,为中国服务器行业带来广阔发展空间。 中国服务器市场龙头效应显著,竞争格局多样化。国内市场以浪潮、新华三和超聚变组成领军阵营,行业集中度较高,竞争格局稳固。AIGC、云计算等新兴技术不断涌现为服务器行业带来新的增长点,各大厂商展开竞争。 图表:2020-2025年中国服务器市场销售量增长情况及预测图表:2022年中国服务器市场份额占比 700 600 500 400 300 200 100 中国服务器市场规模(万台)增长率 13.6% 12.7% 10.7% 9.8% 10.2% 10.4% 16% 12% 8% 4% 浪潮新华三超聚变宁畅中兴戴尔联想其他 0 2020 2021 2022 2023E 2024E 0% 23.1% 28.1% 4.9% 5.1% 5.3% 6.2% 17.2% 10.1% 2025E 资料来源:赛迪顾问,中泰证券研究所 资料来源:IDC,中泰证券研究所7 目录 CONTENTSONTE 中泰所 |领先|深度 2 数据量、算法模型与AIGC三重因素驱动算力需求激增 数据量激增驱动算力需求不断升级 全球数据总量和算力规模高速增长。据IDC数据显示,2022年全球数据圈数据量规模达到103.66ZB,中国数据量规模将从2022的23.88ZB增长至2027年的76.6ZB,CAGR达到26.3%,增速有望位列全球第一。根据IDC预测,未来3年全球新增数据量将超过过去30年之和,数据激增将使数据存储、传输和处理的所需算力呈现指数级增长。 算力智能化升级成为趋势,智能算力成为算力增长的主要动力。海量复杂数据处理需求对于算力提出了更高的要求,需要更强大、更高效的计算资源来支持人工智能应用的发展。在此趋势下,算力基础设施加快建设,成为支撑数字经济发展的“重要底座”,数据能力和算力需求循环增强。IDC预测,中国智能算力规模将持续高速增长,预计2027年将达到1117.4EFLOPS,2022-2027年CAGR达33.9%。 图表:全球数据量规模及预测(单位:ZB) 中国北美全球其他地区 图表:2020-2027年中国智能算力(基于FP16计算)规模及预测(单位:EFLOPS) 智能算力(基于FP16计算)同比增速 300 250 200 150 1200 1000 800 600 106.9% 67.5% 59.4%497.1 616.6 812.5 1117.4 120% 100% 80% 60% 100 50 0 400 200 0 75.0 155.2 259.9 414.3 20.0%24.0% 31.8% 37.5%40% 20% 0% 128.16 105.33 87.73 73.34 79.54 61.7564.13 51.73 52.41 42.18 28.05 23.88 34.55 30.02 38.00 47.89 60.81 76.60 20222023E2024E2025E2026E2027E 资料来源:IDCGlobalDataSphere2023,中泰证券研究所 2020202120222023E2024E2025E2026E2027E 资料来源:IDC,中泰证券研究所9 算法&模型的复杂度提升助推算力需求激增 算法的发展及迭代拉动算力需求。在传统的机器学习和深度学习技术中,算力作为底层基础设施扮演着至关重要的角色,不断推动上层技术迭代创新。目前,深度学习的发展达到高潮,深度学习、机器学习等AI算法的训练和推理过程需要大量的计算资源,为了实现更复杂的人工智能任务,包括图像和语音识别、自然语言处理等,算力提升不可或缺。 模型的快速演进为算力发展提供了强劲动力。随着大模型不断演进,其参数规模和复杂性显著增加。模型越复杂,对算力要求越高,目前超大模型的训练需要大规模计算集群以及对应的模型并行算法框架的支撑,中间算力需求巨大,使算力规模呈现出量级和指数级的上升趋势。 图表:2018-2023年国内外大模型参数量演进情况 发布年份 机构 模型名称 参数量(亿) 发布年份 机构 模型名称 参数量(亿) 2018 AllenInstituteforAI ELMo 0.94 2020 OpenAI GPT-3 1746 2018 OpenAI GPT-1 1.2 2020 微软&英伟达 Megatron-Turing 5300 2018 谷歌 BERT 3 2021 DeepMind Gopher 2800 2019 百度 ERNIE 1.14 2021 谷歌 SwitchTransformer 16000 2019 OpenAI GPT-2 15 2022 Yandex YaLM 1000 2019 微软 DialoGPT 15 2022 谷歌 LAMDA 1370 2019 英伟达 Megatron-LM 83 2022 百度&PCL ERNIE3.0Titan 2600 2020 微软 Turing-NLG 170 2022 谷歌 PaLM 5400 2020 清华大学 GLM 1300 2023 OpenAI GPT-4 18000 资料来源:Deepcontextualizedwordrepresentations、OpenAI官网、谷歌官网、微软官网、英伟达官网、百度官网等,中泰证券研究所10 AIGC模型训练侧算力需求量 AIGC的算力需求可分为训练算力需求和推理算力需求。训练和推理阶段深度学习任务需要大量计算资源。 训练侧:据OpenAI测算,2012年后全球头部AI模型训练算 力需求3-4个月翻一番,每年算力增长幅度高达10倍。 •智能算力方面,以OpenAI训练集群模型估算结果作为参考,ChatGPT-3模型参数约为1746亿个,训练一次需要的总算力约为3640PF-days(以每秒一千万亿次计算需要运行3640天)。2023年推出的GPT-4参数数量可能扩大到1.8万亿个,是GPT-3的10倍,训练算力需求上升到GPT-3的68 倍,在2.5万个A100上需要训练90-100天。 •以微软与英伟达合作推出的MegatronTuring-NLG(MT-NLG)模型为例,该模型拥有5300亿参数,训练过程消耗了4480块A100GPU,最终在自然语言处理任务中表现出卓越性能。 图表:机器学习系统的训练计算趋势 图表:Llama2和GPT-3*训练所使用的算力 模型 参数大小 GPU训练时间(h) GPU型号 Llama27B 70亿 184320 A100-80GB Llama213B 130亿 368640 A100-80GB Llama270B 700亿 1720320 A100-80GB GPT-3* 1750亿 25522880 V100-32GB 资料来源:DeepLn算力云,中泰证券研究所 资料来源:ComputeTrendsacrossThreeErasofMachineLearning,中泰证11 券研究所 AIGC模型推理侧算力需求量 推理:利用训练好的模型进行计算,利用输入的数据获得正确结论的过程,一般为AI技术的应用。推理部署的算力主要在于每个应用场景日数据的吞吐量。 推理侧,由OpenAI论文,推理阶段算力需求=2×模型参数数量×训练及规模。以GPT-3为例,根据天翼智库估算, 500tok