您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [国信证券]:人工智能行业专题(16):Agent驱动全球模型厂MaaS收入爆发,国产模型各有优势 - 发现报告

人工智能行业专题(16):Agent驱动全球模型厂MaaS收入爆发,国产模型各有优势

信息技术 2026-04-17 张伦可,陈淑媛 国信证券 爱吃胡萝卜的猫 
报告封面

行业研究·海外市场专题 互联网·互联网Ⅱ 投资评级:优于大市(维持) 证券分析师:张伦可证券分析师:陈淑媛0755-81982651021-60375431zhanglunke@guosen.com.cnchenshuyuan@guosen.com.cnS0980521120004S0980524030003 报告摘要 •自2026年以来,全球正在经历模型Tokens调用量大爆发的阶段,核心在于模型发展正式进入Agent智能体交互时代。根据OpenRouter数据,截至4月7日中国AI大模型已连续五周调用量超越美国,显示国产模型的崛起。本文主要探讨大模型行业发展趋势、技术、价值链分布等;以及细致梳理国内初创大模型公司和大厂模型的发展现状。 •国产模型与全球模型厂商比较,主要在性价比领域优势明显。在国内Deepeek开源基础上,国产模型着重提升工程化、数据能力,来弥补算力限制。国产模型性价比高主要系:①架构层面算力利用效率领先。以Deepseek为代表的国内厂商针对MoE、注意力机制做了原创性轻量化优化。除此以外,国内厂商(如Kimi、MiniMax)创始初期(23年左右),锚定长上下文路线,针对超长文本场景做了成本全链路优化。②极致定价,中国厂商愿意以接近成本价来换市场份额。 •大模型的商业模式较传统互联网,用户网络效应不明显。AI时代打破传统互联网的发展趋势,用户增长带来的飞轮效应较弱,原因是人为的数据反馈不如机器自己去辨别的更有价值。模型智力水平在当前发展阶段仍是驱动用户、商业化收入增长的最重要因素。 •通过比较国内初创模型企业和大厂的模型布局,我们认为不同团队之间呈现差异化竞争,比如出身清华人工智能实验室的智谱,更加聚焦模型智能上届的突破,适配国产算力;Minimax从发展第一天起着眼于布局全球市场,成为最早出海并实现可观收入的国产模型厂商之一;Deepseek背靠幻方,商业化压力小,引领国产模型架构创新;Kimi着重构建长上下文能力和侧重Agent智能体集群协同能力。 报告摘要 •国产模型的另一派崛起力量来自各个科技大厂。相比起初创公司更加轻盈的组织架构迭代优势,我们观察到各个头部大厂同样积极进行组织调整,提升创新活力与组织调动效率。从25年开始腾讯、字节以技术突破为核心进行组织调整,26年3月阿里巴巴以Token整合上下游帮助组织快速协调。今年下半年各家发布新模型值得关注,阿里、字节等在加速提升模型的编程能力研究外,有望继续在多模态方向突破;结合最新技术负责人背景,腾讯在Agent能力方向有望快速提升。 •大厂在25年重点探索多模态方向,26年补齐Agent方向能力后,有望在多模态+Agent方向拥有优势。长期看,世界模型等是通向泛化AGI必经之路。国内大厂模型在多模态方向拥有优势,比如Qwen3.5实现原生多模态;字节在视觉理解方向拥有优势;腾讯得益于专有数据在3D生成、世界建模有优势。但当前受限于计算资源与数据,聚焦特定领域(如代码)可快速突破能力上限。未来Agent+多模态能力的组合能够帮助:①前端开发全链路提效;②视觉智能体:操作手机/电脑的GUI自动化,空间推理,助力教育科研多模态等。26年4月,阿里发布Qwen3.6-Plus,达到SOTA水平,显著增强了模型的智能体(Agent)编程能力。在前端网页开发,复杂的代码仓库级问题求解表现优秀。 •投资建议:密切关注国产模型厂商进展,包括阿里巴巴(9988.HK)、智谱(2513.HK)、Minimax(0100.HK)、腾讯控股(0700.HK)。 •风险提示:宏观经济波动风险、下游需求不及预期风险、核心技术水平升级不及预期的风险、AI快速迭代平权化下竞争加剧等。 •一、大 模 型 行 业发 展 趋 势 •国 产 模 型 通 过工程化、数据能力弥补算力限制•应 用 部 分 价 值 向 模 型 侧 迁 移 •二、初 创 公 司 模 型 :A G I信 仰 坚 定 ,质 价 比 突 出 •M i n i m ax:质价比突出,管理层眼光前瞻,积极拥抱全球模型变化•智 谱 :学术背景强、全栈自研、幻觉率低,拥抱国产算力•K i m i :长下文能力是优势,拥有智能体群,探索多模态•D e e p s e e k:算法架构上积极创新,开源为国产模型提供基石 •三、大 厂 模 型 : 组 织 调 整 寻 求 创 新 平 衡 , 积 极 探 索 多 模 态等 前 沿 •字 节 跳 动 :深度定制工程栈,通过性价比抢占份额•阿 里 巴 巴 :开 源 全 家 桶 , 架 构 创 新 驱 动•腾 讯 控 股 :多 模 态 等 方 面 有 积 累 , 组 织 调 整 由业 务 驱 动 转 向 向A I原 生 驱 动•小 米 :提 升 后 训 练 阶 段 技 术 , 模 型 与 终 端 产 品 融 合 大模型迭代:26年大模型正式进入Agent时代,从对话走向智能体交互 •根据Semi-Analysis,26年4月,Anthropic ARR超过OpenAI达到300亿美元,成为全球AI收入规模增长最快的大模型公司。 •编程能力被验证是支持Agent智能体发展的核心能力,26年全球正式进入Agent自主完成任务、调用工具的时代。Agent将大模型包装起来,加上了记忆(Memory)、规划(Planning)和工具(Tool Use)。Agent能处理的任务时长,正以“每7个月翻倍”的速度指数增长。 资料来源:METR、国信证券经济研究所整理 Token需求侧:任务复杂性提升推动Token量非线性增长 •随着技术成熟,任务复杂度、Agent占比、多模态任务提升推动Token量非线性增长。A技术迭代使得大模型向“智能体执行”和全模态技术跃迁,任务复杂度从对话→编程→智能体→视频,Token消耗呈指数级增长。1)智能体:Anthropic实测数据显示单任务Token消耗达普通对话的4倍,多Agent协作则高达15倍。根据IDC预测,活跃Agent数量将从2025年的约2860万快速增长至2030年的22.16亿,这意味着单一用户的调用强度将持续放大。2)多模态:根据火山引擎,生成一段15秒纯生视频就消耗30.9万Token,测算是普通对话21倍。 资料来源:IDC,国信证券经济研究所整理 全球企业AI采用率自25年起快速提升 •OpenAI、Anthropic、谷歌在全球B端大模型中占优。根据RampAl,美国企业AI采用量总体48%,其中OpenAI34%,Anthropic24%。 •千问、豆包、Deepseek在国内B端市场占优。根据Frost &Sullivan,在中国大模型B端市场,2025H2,千问(Qwen)系列模型的日均Token调用量优势扩大,占比32.1%,字节豆包为21.3%、DeepSeek为18.4%。,根据国家统计局,截至2026年3月,中国国内日均Token(词元)调用量已突破140万亿,增长超1400倍。 资料来源:字节跳动、谷歌、OpenAI、国家统计局、国信证券经济研究所整理 资料来源:Ramp Al Index,国信证券经济研究所整理 Agent能力提升:模型架构、工程化、数据构建多维优势 •在Transformer架构未发生颠覆性变革的背景下,架构红利边际递减。全球大模型架构基本收敛到Transformer / MoE。 •在国内Deepeek、千问开源基础上,国产模型着重提升工程化、数据能力,来弥补算力限制。在国内算力紧缺背景下,单纯堆叠参数(如从千亿到万亿)带来的能力提升成本过高。工程化能力与高质量数据(思考过程等)是国产大模型提升能力和商业化价值的重要因素。 测评集:场景洞察与评测集构建的意义在增强 •传统通用榜单已无法准确衡量AI时代的真实生产力价值,模型厂商正转向构建以业务价值为核心的私有化、场景化自定义评测体系。姚顺雨(OpenAI前研究科学家)于2025年4月GitHub平台发布的一篇博客文章表示:AI正处在“中场休息”阶段,上半场是训练大于评估,下半场将是评估大于训练,重心转向"定义问题"。根据晚点访谈Minimax闫俊杰“中国跟美国模型的一个区别,就是缺少内部定义的benchmark,一些自己的底层思考和设计,更多是在对齐O1等模型的输出。” •例如智谱发布龙虾场景端到端Agent评测基准ZClawBench。腾讯模型新基准CL-bench,测试大模型“从上下文中学习”的能力。 全球头部模型已进入自训练、自进化阶段 •更好的模型可以导向更好的应用,但更好的应用和更多用户并不会导向更好的模型。这个现象的底层原理是,在日常使用中,模型比大部分用户更聪明,大部分用户的query(查询)没有模型自己模拟得好。必须训练好模型,才能够筛选出优质数据。 •模型具有自进化能力有,全球头部模型已进入自训练阶段。自进化(Self-Evolution)是指模型能够自主获取、精炼和学习自身生成的经验,形成一个持续自我优化的闭环系统。比如minimax的M2.7在内部测试中,模型可连续执行超过100轮“分析—改进—验证”的循环,自主调整采样参数、优化工作流策略,并在内部评测集中实现约30%的效果提升。公司在部分研发流程中,M2.7已可承担30%至50%的工作量。26年3月,根据小米MiMo大模型负责人罗福莉在谈及AI在未来一年最大的发展变化时表示,一年前大模型实现‘自进化’需要3—5年的历程,现在觉得1—2年就能完成。 AI Agent时代:用户获取服务的方式或发生变化 •OpenClaw是智能体计算机的操作系统,OpenClaw的爆火标志着AI从“对话助手”向“执行员工”的范式跃迁。 •AI时代能力供给、分发模式去中心化。与传统互联网不同的是,App Store是「人找App」,AI时代ClawHub(技能市场)更多是「AI自主发现/调用技能」,用户感知更间接。我们认为一些简单的功能将会被Skill等内生化,沦为原子化服务集,一些电商、生活服务落地基建层价值仍存在。未来技能竞争焦点从争夺App Store曝光,变为:①能否被AI高效调用(接口标准化、可靠性);②在垂直领域是否不可替代(专业度、数据壁垒、基建壁垒)等。 资料来源:普华永道、国信证券经济研究所整理 资料来源:Star-history.com,国信证券经济研究所整理 AI Agent时代:模型巨头开启广告模式,需观察对传统广告市场影响 •大模型基座(规则):根据姚顺雨在语言即世界的访谈,底座是少数强大的基础模型(单极),上层是围绕不同交互方式构建的海量、多元Agent应用生态。当前,大模型主要通过出售算力(Token)和模型能力调用许可来收费。比如根据TechCrunch,微软会将Bing和Azure OpenAI服务约20%的收入返还给OpenAI。 •AI智能体/应用(决策):差异包括Harness等。①任务调度与编排能力;②私有数据与上下文记忆。③技能生态的集成与优化等。封装的OpenClaw,控制了用户与AI交互的首要入口和调度规则。曾经APP通过掌握中心化分发能力所取得的广告费用有可能受到影响。根据Axios,4月OpenAI计划,2030年广告收入达到1000亿美元,每次对话展示1-2条"Sponsored"推荐卡片,与AI回答物理隔离。 资料来源:OpenAI、AXIOS、新浪科技,国信证券经济研究所整理 Harness Engineering:模型外的“控制与支撑系统” •Harness Engineering是提前把“上下文、约束和验证方式”设计成AI可以理解的结构,让模型在环境里自主运行。包括工具调用、分层上下文工程、长记忆管理、工作流设计等系统工程手段等。 •案例:腾讯通过三个维度强化Harness与工程能力。①智能体开发平台(ADP):通过RAG、知识库为智能体提供“图书馆”;②安全沙箱与Agent Runtime。③全面的安全方案。④记忆能力:腾