2025年: 市场重心在训练或训推一体算力,以满足大模型迭代需求2025年底:需求重心转向推理业务大规模部署,谷歌、Meta、微软等国际厂商开始大量部署推理产品(含英伟达、AMD推理优化产品及自研ASIC),异构推理产品关注度提升,直接导致2026年初CPU大量缺货; -2026年关键驱动:-SeeDance2.0类文 国产AI芯片调研:2025-2026年AI算力市场需求结构变化(推理到训练) 2025年: 市场重心在训练或训推一体算力,以满足大模型迭代需求2025年底:需求重心转向推理业务大规模部署,谷歌、Meta、微软等国际厂商开始大量部署推理产品(含英伟达、AMD推理优化产品及自研ASIC),异构推理产品关注度提升,直接导致2026年初CPU大量缺货; -2026年关键驱动:-SeeDance2.0类文生视频产品:技术突破(生成效果、时长、分辨率提升) 引发复杂业务场景对强推理能力的迫切需求;-OpenClaw类Agent应用:拉近AI与普通用户距离,催生大量潜在部署尝试,推动并发推理需求激增;市场影响:从快速增长转为推理算力爆发式增长,并显著提升国内外异构芯片的关注度,推理市场份额或被ASIC或异构架构侵蚀;推理算力两大场景分析: 高负载场景(文生视频) 主要芯片:目前主要运行在英伟达H系列和AMD产品上,华为昇腾910C仅有少量尝试性部署; -现状:SeeDance2.0 突破后需求激增,算力缺口巨大,国产卡因技术成熟度、软件适配等原因,尚未能有效承接此核心业务。 性能门槛:国产卡综合性能不能低于英伟达H20/A800,需对标并超越AMDMI308,且性价比不输;潜在替代:华为昇腾910C勉强能应付,寒武纪690部分指标接近H20,但底层软件兼容性不理想高并发场景(Agent应用)特点:对单卡性能要求不如文生视频极致,但追求极致性价比以支撑大规模用户并发承载芯片:可在4090、5090等消费级显卡上部署,为不同层级芯片提供了市场空间; 有关昇腾950和寒武纪690:950: 昇腾采用类GPU架构,软件兼容性和代码移植有原生优势,软件栈可从昇腾910C 平滑过渡,是文生视频领域的潜在有; 产能是最大瓶颈,其采用的高端制程对国产供应链实现大规模量产难度大690: 公司战略重心是确保在字节跳动现有核心业务(搜广推)中的地位,这是其主要营收来源,因此无足够精力/意愿去拓展文生视频等复杂新场景; 寒武纪在字节核心场景:-大模型业务:覆盖豆包、SeeDance2.0、扣子及部分电商应用;-搜广推业务: 寒武纪占比最大的业务,核心是训练环节需根据用户行为实时/近实时生成个性化模型并推理,服务数亿活跃用户分时占用算力卡,理想需求达百万至千万级算力卡模型特点:搜广推使用传统AI模型(非大语言模型),参数量不大,核心挑战是高实时性与并发性;当前训练模式: 寒武纪芯片未实现真正并发训练,采用单卡分时间片轮流为不同用户模型训练; 字节搜广推场景:模型特点:非大语言模型,而是传统AI模型,参数量不大; 核心挑战:极高的实时性和并发性,需要为数亿活跃用户进行近实时的个性化模型训练和推理;寒武纪: 目前未实现真正并发训练,而是采用单张卡分时间片,轮流为不同用户模型训练,在搜广推训练场景中,寒武纪芯片表现未达理想状态,英伟达产品更理想,但因英伟达卡数量有限需优先保障其他业务,故仍大量使用寒武纪;推理芯片:搜广推推理任务使用了多种芯片,包括华为昇腾、英伟达早期产品、部分AMD产品; 国内大厂训练算力:字节: 训练芯片:并非完全依赖英伟达,有一部分采用华为芯片;部署策略:采用海外训练基座模型+ 国内训练垂直模型的策略,规避数据合规风险(核心敏感数据不出境),同时利用国内数据训练专用模型自行采购持有算力资产,面临进口限制风险,故将基座训练移至海外; 阿里&腾讯: 混元等通用大模型目前仍在国内训练部署策略: 采用租用模式,与第三方算力中心合作,由第三方负责建设、承担进口高端芯片风险,再通过协议提供 算力,规避了直接进口的风险差异:与字节的自建模式根本不同,国内模型多在开源模型基础上进行二次开发,对算力需求远低于国外原生模型,租用模式可满足需求;