行业研究 报计算机 告 应用华为AI一体机正在成为算力行业趋势 2023-11-19 行业周报 看好/维持 计算机 走势对比 报告摘要 35% 太 26% 平 18% 9% 洋(0%) 证(9%) 23/7/21 23/9/21 券股 22/11/21 23/1/21 23/3/21 23/5/21 计算机沪深300 华为AI一体机已成行业共识,有望成为大模型在B端落地的主流路径。据我们不完全统计,截至本周末,已有科大讯飞、云从科技等11家厂商发布了昇腾AI大模型一体机解决方案,涉及政务、教育、医疗、安全等多个垂直领域。我们认为政企客户的数据安全需求较强,且在AI方面的技术开发能力相对较弱,因此具有较强的大模型私有化部署需求,AI一体机或成为大模型在B端落地的主要形态。 份子行业评级 有 限推荐公司及评级 公司证券 研相关研究报告: 究《从云从科技看华为AI一体机市 报场空间上限》--2023/11/14 告《算力国产化是国内AI产业发展 的长期趋势》--2023/11/12 《盈利能力提升,新上线AI产品》 --2023/11/06 证券分析师:曹佩 电话: E-MAIL:caopeisz@tpyzq.com 执业资格证书编码:S1190520080001 华为AI一体机具有训推一体机和推理一体机两种形态。训推一体机一般预置AI大模型引擎,并且也将用户的需求例如知识库问答、 知识图谱、AI生图等功能,相应的芯片算力能力更高,用户部署在自有的环境下更加易于开发相关的AI应用。因此,成为训推一体机供应厂商的要求也就更高。 华为AI一体机市场空间达千亿级别。根据国家统计局数据,2022年全国大型企业超过万家,中型企业接近3万家,小型企业则达到 了近124万家;根据国家统计局数据,2022年全国医院有3.7万个; 根据教育部发布的2022年全国教育事业发展统计公报显示,全国共 有各级各类学校51.85万所;根据前瞻网,截至2023年8月,国内智算中心有40个,2022-2026年中国智能算力规模复合增长率达47.58%。根据恒为科技11月16日公告,公司中标AI算力一体机 480柜,中标总金额为21.12亿元。可得平均单价为440万元/台。因此,仅企业市场(中大型企业每家采购一台AI一体机),AI一体机市场就接近千亿规模。如果再计算学校、医院、数据中心市场,则市场将更加庞大。如果英伟达完全禁止向中国出口H800芯片,则现在的AI一体机市场可能成为华为AI一体机等国产AI一体机的市场空间上限。 投资建议:重点推荐云从科技、科大讯飞,建议重点关注软通动力、安恒信息、恒为科技、医渡科技、云天励飞。 风险提示:技术研发不及预期;生态建设不及预期;政策落地不及预期;中美贸易摩擦升级。 请务必阅读正文之后的免责条款部分守正出奇宁静致远 一、算力供需矛盾突出,国产算力迎来发展良机 ChatGPT更新后使用量激增,OpenAI算力再次告急。自11月6日OpenAI开发者大会以来,GPTs应用井喷式增长。与此同时,激增的用户数导致ChatGPT服务出现故障,大 量用户报告无法使用ChatGPT和API,访问页面显示“ChatGPT目前容量已满”。根据网络状况监测网站Downdector的数据,整个大规模故障时间持续了约2个小时。11月15日,OpenAICEO山姆·奥特曼公开发文,表示将暂停新的ChatGPTPlus注册,开发日后使用量的激增超出了其承受能力,希望确保每个人都有良好的体验。 国内AI芯片市场规模快速增长,英伟达占据八成以上份额。根据艾瑞咨询测算, 2022年中国的AI芯片市场规模约为385亿元,到2027年将有望达到2164亿元。据IDC数据,2022年中国AI加速卡(公开市场)出货量约为109万张,其中英伟达市占率为85%,华为市占率为10%,百度2%、寒武纪和燧原均为1%;2023上半年,中国加速芯片市场规模超50万张,本土品牌出货量超5万张,占比达10%,英伟达占比仍在90%左右。 图表1:中国AI芯片市场规模及增速图表2:2022年中国AI加速卡市场份额 2500 2000 1500 1000 500 0 2164 2020202120222023E2024E2025E2026E2027E 80% 1675 1210 827 566 385 195 327 70% 60% 50% 40% 30% 20% 10% 0% 市场规模(亿元)yoy英伟达华为百度寒武纪燧原其他 资料来源:艾瑞咨询,太平洋证券整理资料来源:IDC,太平洋证券整理 美国再次收紧芯片出口管制,英伟达针对禁令推出改款GPU,但相较国产芯片性价比不高。10月17日,美国商务部工业和安全局(BIS)发布了针对芯片的出口管制新规,对包括英伟达高性能AI芯片在内的半导体产品施加新的出口管制,涉及型号包括 英伟达A800、H800、L40S等,限制条款已经于10月23日生效。据钛媒体报道,英伟达针对中国市场开发了H100的改良版芯片HGXH20。H20的FP16稠密算力达到148TFLOPS,是H100算力的15%左右。H20通过提升缓存和带宽从而达到多卡堆叠时的高性能, 请务必阅读正文之后的免责条款部分守正出奇宁静致远 NVLink由400GB/s升级至900GB/s,并采用CoWoS先进封装技术,同时增加了一颗HBM3到96GB,但成本也随之增加240美元。对比昇腾910,H20的FP16和INT8算力均处于劣势,我们认为英伟达该款产品相较于国产AI芯片而言性价比较低。 图表3:英伟达H100、H20、昇腾910参数对比 产品规格/型号 H100 HGXH20 昇腾910 FP32 67TFLOPS 44TFLOPS FP16TensorCore 1979TFLOPS 148TFLOPS 320TFLOPS INT8TensorCore 3958TOPS 296TFLOPS 320TOPS GPU显存 80GB 96GB GPU显存带宽 3.35TB/s 4.0TB/s 互连技术 NVLink:900GB/sPCIe5.0:128GB/s NVLink:900GB/sPCIe5.0:128GB/s 最大热设计功率(TDP) 700W 400W 310W 发布时间 2022年3月 2023年11月 2019年8月 资料来源:英伟达官网,IT之家,昇腾官网,太平洋研究院整理 国内算力租赁开启涨价趋势。11月14日,汇纳科技公告,由于内嵌英伟达A100芯 片的高性能算力服务器算力需求大幅增加,相关高性能运算设备持续涨价,算力资源持续紧张,公司拟将所受托运营的内嵌英伟达A100芯片的高性能算力服务器算力服务收费同步上调100%。而根据中贝通信9月-11月公告的算力租赁合同,可以看到租赁单价出现了明显的上涨。 图表4:中贝通信公告的算力租赁合同内容及金额 公告时间 采购方 服务内容 合同金额 2023/11/15 北京中科新远科技有限公司 提供共计1920PAI算力技术服务,共计提供128套高性能算力一体机柜,单机柜算力不低于15P,服务周期一年 单价为18万元/P/年,合同总金额为人民币34560万元 2023/10/24 WILDLOOKTECHPTE.LTD 意向租赁容量为800P(FLOPS@FP16),租赁期限12个月 单价2.5万美元/P/年,预计租赁费总金额为2000万美元 2023/9/18 济南超级计算中心有限公司 提供包括算力服务、带宽、存储在内的相关服务(含A800算力服务器60台),服务周期60个月 合同总金额为18000万元 2023/9/6 中国联合网络通信有限公司青海省分公司 以H800设备为基础搭建算力服务平台,提供960P算力服务,协议服务期限三年 单价12万元/P/年计算,服务费总金额为含税34560万元 资料来源:公司公告,太平洋研究院整理 阿里云停止A100算力出租。据媒体报道,阿里云官网已经暂停A100服务器出租业 务。目前,阿里云官网提供的GPU云服务器仅支持V100、T4等性能较低的GPU。 图表5:阿里云官网提供的GPU云服务器不再支持A100 资料来源:阿里云官网,太平洋研究院整理 我们认为,OpenAI推出GPTs功能,大幅降低AI应用的开发门槛,全球AI应用即将进入量变引发质变的新阶段。随着爆款应用的不断出现,必将拉动算力需求的快速增长。国内英伟达的禁售导致算力需求紧缺情况加剧,我们认为国产算力有望取代英伟达占据的市场份额,国产AI芯片、AI服务器、AI一体机将核心受益。 二、AI大模型一体机有望成为国产算力的主流形态 (一)什么是AI大模型一体机? AI大模型一体机本质可以理解为AI服务器叠加大模型私有化部署。大模型一体机是一种软硬结合的设备,集成了AI芯片、AI平台软件及各类模型算法。一般而言,大模型训练过程需要将数据传输到中央服务器或云端进行计算,然后再传回结果,这涉 及了大量的数据传输和网络延迟。而大模型一体机将模型预置在服务器中,能够实现大模型的私有化部署。 图表6:AI一体机应用架构 资料来源:华鲲振宇微信公众号,太平洋研究院整理 华为联合合作伙伴发布昇腾AI大模型推训一体解决方案。2023年7月6日,在昇腾人工智能产业高峰论坛上,华为联合四家伙伴共同发布昇腾AI大模型训推一体化解决 方案。结合昇腾AI基础软硬件能力和伙伴模型和平台优势,通过嵌入四家伙伴各自在大模型训练、微调和优化方面的算法和模型能力,共同设计、联合开发、协同上市、持续迭代,实现为客户提供更全面的解决方案,更能满足全场景、全行业客户使用。图表7:昇腾联合四家合作伙伴发布大模型推训一体化解决方案 资料来源:昇腾官网,太平洋研究院整理 (二)为什么需要AI一体机? 原因一:本地化部署,数据不脱离内网 相对于互联网客户,政府、金融、电信等行业客户具备大量敏感数据,处于对数据安全、隐私安全的考虑,上述客户对于使用大模型,以及将数据上传至云端进行训练持保守态度。事实上,国外部分大型企业已限制了对AI的使用。据Insider报道,一些大公司正在限制其员工对ChatGPT的访问,如亚马逊和苹果均表示担心人工智能可能带来的数据泄露风险。据不完全统计,14家大公司已对其员工如何使用人工智能发出禁令或限制,包括苹果、亚马逊、三星、Spotify、Verizon、富国银行、德意志银行、摩根大通等。 我国对AI监管的重视也日益提升。11月16日,国家安全部在其官微发表题为《如何化解人工智能带来的国家安全挑战》中提出五点风险,其中包括:数据泄露风险:人工智能需要海量的数据来进行学习和训练,这些数据中可能包含用户大量敏感信息。如果这些信息被滥用或泄露,可能会对个人隐私、国家安全造成严重危害。“数据投毒”风险:是指在人工智能训练数据中投放恶意数据,干扰数据分析模型正常运行的行为。 原因二:软硬结合,开箱即用 企业在大模型开发全流程中,常常面临切换硬件集群、适配底层硬件以及微调优化等复杂问题。采用AI一体机可以实现在同一个集群内无缝切换大模型的训练和推理过程,从而为客户提供高效的大模型训练和推理部署流程;同时,解决方案内置了大模型推理引擎、调优工具和算子加速库,支撑客户开箱即用,无需进行二次硬件适配,即可让客户能够直接使用大型预训练模型,从而降低了技术门槛;此外,通过芯片层面的算法调优,能够充分释放硬件性能,从而提升模型训练和推理的效率。 政府、金融、电信等关键行业客户需求较高。根据信通院数据,我国AI算力应用占比最大的行业是互联网,随后依次是政府、服务业、电信、金融、制造业等。其中,政府、电信、金融、教育、运输等关键行业的算力应用占比接近40%。我们认为上述客 户的数据安全需求较强,且在AI方面的技术开发能力相对较弱,因此具有较强的大模型私有化部署需求,是AI一体机的主要潜在市场。 图表8:我国各行业算力应用分布情况 运输,1.8% 制造,4