行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

国产AI芯片调研20252026年AI算力市场需求结构变化推理到训

2026-03-09 未知机构乐

2025年市场重心在训练或训推一体算力，以满足大模型迭代需求。2025年底需求转向推理业务大规模部署，谷歌、Meta、微软等国际厂商开始大量部署推理产品，导致2026年初CPU大量缺货。

2026年关键驱动：
- SeeDance2.0类文生视频产品引发复杂业务场景对强推理能力的迫切需求。
- OpenClaw类Agent应用拉近AI与普通用户距离，催生大量潜在部署尝试，推动并发推理需求激增。

市场影响：从快速增长转为推理算力爆发式增长，显著提升国内外异构芯片关注度，推理市场份额或被ASIC或异构架构侵蚀。

推理算力两大场景分析：

高负载场景（文生视频）
- 主要芯片：目前主要运行在英伟达H系列和AMD产品上，华为昇腾910C仅有少量尝试性部署。
- 现状：SeeDance2.0突破后需求激增，算力缺口巨大，国产卡因技术成熟度、软件适配等原因，尚未能有效承接此核心业务。
- 性能门槛：国产卡综合性能不能低于英伟达H20/A800，需对标并超越AMD MI308，且性价比不输。
- 潜在替代：华为昇腾910C勉强能应付，寒武纪690部分指标接近H20，但底层软件兼容性不理想。
高并发场景（Agent应用）
- 特点：对单卡性能要求不如文生视频极致，但追求极致性价比以支撑大规模用户并发承载。
- 芯片：可在4090、5090等消费级显卡上部署，为不同层级芯片提供了市场空间。

有关昇腾950和寒武纪690：

昇腾950：
- 昇腾采用类GPU架构，软件兼容性和代码移植有原生优势，软件栈可从昇腾910C平滑过渡，是文生视频领域的潜在有力竞争者。
- 产能是最大瓶颈，其采用的高端制程对国产供应链实现大规模量产难度大。
寒武纪690：
- 公司战略重心是确保在字节跳动现有核心业务（搜广推）中的地位，因此无足够精力/意愿去拓展文生视频等复杂新场景。
- 寒武纪在字节核心场景：
  - 大模型业务：覆盖豆包、SeeDance2.0、扣子及部分电商应用。
  - 搜广推业务：寒武纪占比最大的业务，核心是训练环节需根据用户行为实时/近实时生成个性化模型并推理，服务数亿活跃用户，理想需求达百万至千万级算力卡。
- 当前训练模式：寒武纪芯片未实现真正并发训练，采用单卡分时间片轮流为不同用户模型训练。
- 搜广推场景：模型特点为传统AI模型，参数量不大，核心挑战是高实时性与并发性。
- 推理芯片：搜广推推理任务使用了多种芯片，包括华为昇腾、英伟达早期产品、部分AMD产品。

国内大厂训练算力：

字节：
- 训练芯片：并非完全依赖英伟达，有一部分采用华为芯片。
- 部署策略：采用海外训练基座模型+国内训练垂直模型的策略，规避数据合规风险，同时利用国内数据训练专用模型，自行采购持有算力资产，面临进口限制风险，故将基座训练移至海外。
阿里&腾讯：
- 混元等通用大模型目前仍在国内训练部署。
- 策略：采用租用模式，与第三方算力中心合作，由第三方负责建设、承担进口高端芯片风险，再通过协议提供算力，规避了直接进口的风险。
- 差异：与字节的自建模式根本不同，国内模型多在开源模型基础上进行二次开发，对算力需求远低于国外原生模型，租用模式可满足需求。

2025年: 市场重心在训练或训推一体算力，以满足大模型迭代需求2025年底:需求重心转向推理业务大规模部署，谷歌、Meta、微软等国际厂商开始大量部署推理产品(含英伟达、AMD推理优化产品及自研ASIC)，异构推理产品关注度提升，直接导致2026年初CPU大量缺货; -2026年关键驱动:-SeeDance2.0类文国产AI芯片调研:2025-2026年AI算力市场需求结构变化(推理到训练) 2025年: 市场重心在训练或训推一体算力，以满足大模型迭代需求2025年底:需求重心转向推理业务大规模部署，谷歌、Meta、微软等国际厂商开始大量部署推理产品(含英伟达、AMD推理优化产品及自研ASIC)，异构推理产品关注度提升，直接导致2026年初CPU大量缺货; -2026年关键驱动:-SeeDance2.0类文生视频产品:技术突破(生成效果、时长、分辨率提升) 引发复杂业务场景对强推理能力的迫切需求;-OpenClaw类Agent应用:拉近AI与普通用户距离，催生大量潜在部署尝试，推动并发推理需求激增;市场影响:从快速增长转为推理算力爆发式增长，并显著提升国内外异构芯片的关注度，推理市场份额或被ASIC或异构架构侵蚀;推理算力两大场景分析: 高负载场景(文生视频) 主要芯片:目前主要运行在英伟达H系列和AMD产品上，华为昇腾910C仅有少量尝试性部署; -现状:SeeDance2.0 突破后需求激增，算力缺口巨大，国产卡因技术成熟度、软件适配等原因，尚未能有效承接此核心业务。性能门槛:国产卡综合性能不能低于英伟达H20/A800，需对标并超越AMDMI308，且性价比不输;潜在替代:华为昇腾910C勉强能应付，寒武纪690部分指标接近H20，但底层软件兼容性不理想高并发场景(Agent应用)特点:对单卡性能要求不如文生视频极致，但追求极致性价比以支撑大规模用户并发承载芯片:可在4090、5090等消费级显卡上部署，为不同层级芯片提供了市场空间; 有关昇腾950和寒武纪690:950: 昇腾采用类GPU架构，软件兼容性和代码移植有原生优势，软件栈可从昇腾910C 平滑过渡，是文生视频领域的潜在有; 产能是最大瓶颈，其采用的高端制程对国产供应链实现大规模量产难度大690: 公司战略重心是确保在字节跳动现有核心业务(搜广推)中的地位，这是其主要营收来源，因此无足够精力/意愿去拓展文生视频等复杂新场景; 寒武纪在字节核心场景:-大模型业务:覆盖豆包、SeeDance2.0、扣子及部分电商应用;-搜广推业务: 寒武纪占比最大的业务，核心是训练环节需根据用户行为实时/近实时生成个性化模型并推理，服务数亿活跃用户分时占用算力卡，理想需求达百万至千万级算力卡模型特点:搜广推使用传统AI模型(非大语言模型)，参数量不大，核心挑战是高实时性与并发性;当前训练模式: 寒武纪芯片未实现真正并发训练，采用单卡分时间片轮流为不同用户模型训练; 字节搜广推场景:模型特点:非大语言模型，而是传统AI模型，参数量不大; 核心挑战:极高的实时性和并发性，需要为数亿活跃用户进行近实时的个性化模型训练和推理;寒武纪: 目前未实现真正并发训练，而是采用单张卡分时间片，轮流为不同用户模型训练，在搜广推训练场景中，寒武纪芯片表现未达理想状态，英伟达产品更理想，但因英伟达卡数量有限需优先保障其他业务，故仍大量使用寒武纪;推理芯片:搜广推推理任务使用了多种芯片，包括华为昇腾、英伟达早期产品、部分AMD产品; 国内大厂训练算力:字节: 训练芯片:并非完全依赖英伟达，有一部分采用华为芯片;部署策略:采用海外训练基座模型+ 国内训练垂直模型的策略，规避数据合规风险(核心敏感数据不出境)，同时利用国内数据训练专用模型自行采购持有算力资产，面临进口限制风险，故将基座训练移至海外; 阿里&腾讯: 混元等通用大模型目前仍在国内训练部署策略: 采用租用模式，与第三方算力中心合作，由第三方负责建设、承担进口高端芯片风险，再通过协议提供算力，规避了直接进口的风险差异:与字节的自建模式根本不同，国内模型多在开源模型基础上进行二次开发，对算力需求远低于国外原生模型，租用模式可满足需求;

点击免费查看完整报告

国产AI芯片调研20252026年AI算力市场需求结构变化推理到训

你可能感兴趣

电子行业周报：头部CSP资本开支持续高增，平头哥发布全自研AI训推一体芯片

【风口研报·公司】一季度业绩增长超150_，分析师强call公司智算业务订单增加明显，且前瞻布局国产芯片LPU赛道，有望强化公司自身从AI训练到AI推理的卡位优势；策略：AI与能化构成-20260506

恒为科技：算力调优&训推一体机打开AI成长空间

AI系列报告（01）：AGI驱动算力芯片增长，国产芯片加速替代

中泰通信盛科通信国产交换芯片龙头高速率突破受益AI算力增长

信息技术行业动态点评：美国升级AI芯片出口禁令，国产AI算力产业链崛起

半导体设备行业深度：AI芯片快速发展，看好国产算力带动后道测试、先进封装设备需求

电子行业专题研究：国产AI算力芯片全景图

通信行业周报：国产大模型与芯片配套迭代，全球AI算力投资持续景气

计算机行业月报：AI应用大发展令算力总体供不应求，国产AI芯片厂商迎来重要发展机遇