行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

计算机行业研究：算力再次加速的底层逻辑

信息技术 2026-03-21 刘高畅国金证券艳阳天Cathy

计算需求范式跃迁：从Prompt到长Agent

1. 从Prompt到长Agent的变迁

人工智能交互范式正从单次问答（Prompt）转变为能够推理、规划和持续运行的自主Agent。OpenRouter平台数据显示，多步骤推理和链式工具调用正快速取代传统单轮交互。开源Agent框架OpenClaw以超过24.8万GitHub星标登顶，标志着长运行Agent从实验阶段全面进入生产部署。

2. Agent上下文长度的结构性增长

Agent任务对Token的消耗远超传统问答场景。Anthropic实测显示，单Agent消耗约为对话模式的4倍，多Agent系统高达15倍。NVIDIA指出，下一代AI工厂需处理数十万输入Token以支撑Agentic推理所需的长上下文。

3. 长Agent驱动算力需求非线性提升的原因

3.1 大模型架构的天然机制

大模型自注意力机制计算成本与上下文长度呈二次方增长。
推理Decode阶段受制于内存带宽，KVCache随上下文线性膨胀导致GPU利用率下降。
主流厂商按上下文长度分档定价（如谷歌Gemini 3.1 Pro、阿里云Qwen）。

3.2 多Agent通信开销

多Agent协作架构兴起，Gartner数据显示企业询盘量暴增1445%。
Google DeepMind研究指出，并行Agent间全局上下文压缩传递产生“协调税”，通信成本随Agent数量非线性扩大。

3.3 杰文斯悖论效应

模型推理效率提升刺激使用量更快增长，微软CEO纳德拉预判AI使用量呈爆炸式增长。

4. 投资建议

5. 风险提示

行业竞争加剧风险。
技术迭代不及预期风险。
特定行业下游资本开支周期性波动风险。

计算需求范式跃迁：从Prompt到长Agent 1）人工智能的交互范式正在经历根本性转变，AI系统已从单次问答工具演进为能够推理、规划、持续运行的自主Agent，趋势已获明确印证：OpenRouter平台数据显示多步骤推理和链式工具调用正在快速取代传统单轮交互。开源Agent 框架OpenClaw发布仅四个多月便以超过24.8万GitHub星标登顶全球开源项目榜首，标志着长运行Agent从实验阶段全面进入生产部署。2)Agent任务对Token的消耗已远超传统问答场景：Anthropic实测数据显示，单Agent消耗约为对话模式的4倍，多Agent系统则高达15倍。NVIDIA在其2026年1月技术博客中亦明确指出，下一代AI工厂必须具备处理数十万输入Token的能力，以支撑Agentic推理所需的长上下文。范式跃迁已经发生，算力需求的新增长逻辑形成。长Agent驱动算力需求非线性提升长Agent对算力需求的拉动有几个核心原因：1）技术机制：首先大模型自注意力机制的计算成本与上下文长度呈二次方增长，其次推理Decode阶段天然受制于内存带宽，随着KVCache随上下文线性膨胀，GPU利用率持续下降，吞吐瓶颈日益突出，主流厂商的定价结构就是物理成本的体现：谷歌Gemini 3.1 Pro和阿里云Qwen均采用按上下文长度分档的阶梯定价。2）多Agent协作架构的兴起引入了额外的通信开销维度。Gartner数据显示，2024年Q1至2025年Q2企业对多Agent系统的询盘量暴增1445%；而Google DeepMind研究指出，并行Agent之间的全局上下文压缩传递会产生不可避免的"协调税"，通信成本随Agent数量非线性扩大。3）杰文斯悖论进一步放大了上述效应，微软CEO纳德拉预判，模型推理效率的提升带来成本下降反而刺激使用量以更快速度增长。综合分析，我们认为Agent运行时长的增加是技术趋势的必然，在可见的未来，对内存带宽、互联吞吐与智能计算密度的需求，将持续以非线性速率扩张。投资建议相关标的：海外算力/存储：中际旭创、东山精密、胜宏科技、天孚通信、新易盛、工业富联、兆易创新、大普微、源杰科技、景旺电子、英维克等；Lumentum、闪迪、铠侠、美光、SK海力士、中微公司、北方华创、拓荆科技、长川科技。国内算力：寒武纪、东阳光、海光信息、协创数据、豫能控股、华丰科技、亿田智能、星环科技、网宿科技、首都在线、神州数码、百度集团、大位科技、润建股份、中芯国际、华虹半导体、中科曙光、润泽科技、浪潮信息、东山精密、奥飞数据、云赛智联、瑞晟智能、科华数据、潍柴重机、金山云、欧陆通、杰创智能。 CPU：海光信息、中科曙光、澜起科技、禾盛新材、中国长城、龙芯中科、兴森科技、深南电路、宏和科技、广合科技。 AI应用：1）超级入口：腾讯控股、Minimax、智谱、阿里巴巴、科大讯飞。2）星环科技、德才股份、美年健康、中控技术、卓易信息、昆仑万维等AI INFRA&高增长&高壁垒。其他：空天时代、具身智能等。风险提示行业竞争加剧的风险；技术迭代不及预期的风险；特定行业下游资本开支周期性波动的风险。一、计算需求范式跃迁：从Prompt到长Agent 1.1从Prompt到长Agent的变迁据英伟达GTC 2026大会博客，人工智能正从简单的、基于Prompt的工具发展成为能够推理、规划和行动的智能、长期运行的系统。这些自主Agent不仅能生成文本，还能编写代码、调用工具、分析数据、模拟结果并持续改进。大模型聚合平台OpenRouter的报告也提到LLM的使用正从单回合交互转向智能推理，模型需要进行规划、推理和执行，并跨越多个步骤。它们不再生成一次性响应，而是协调工具调用、访问外部数据，并迭代优化输出以达成目标。早期证据表明，多步骤查询和链式工具使用正在增加。随着这种范式的扩展，评估标准将从语言质量转向任务完成度和效率。下一个竞争前沿是模型执行持续推理的有效性，这一转变最终可能会重新定义大规模智能推理在实践中的意义。科创板日报2026年3月3日报道，发布仅四个多月的开源智能体项目OpenClaw创造了历史——以超过24.8万的GitHub星标数正式登顶星标榜，超越Linux成为GitHub平台上最受欢迎的开源项目。OpenClaw的爆炸性扩散，标志着长运行Agent从实验阶段进入大规模生产部署。 1.2Agent上下文长度的结构性增长 Agent任务中模型所需处理的Token数量往往远超传统问答场景。 Anthropic发表的测试数据表示智能体通常比聊天交互消耗的令牌多约4倍，而多智能体系统比聊天消耗的令牌多约15倍。英伟达2026年1月的技术博客对下一代AI工厂的计算需求做出了明确定性：为了大规模地提供这些功能，下一代AI工厂必须处理数十万个输入标记，以提供智能推理、复杂工作流程和多模态管道所需的长期上下文，同时在功率、可靠性、安全性、部署速度和成本的限制下维持实时推理。二、为何长Agent驱动算力需求非线性提升 2.1：大模型架构的天然机制首先广为人知的点在于大模型的自注意力机制的计算成本与上下文长度呈二次方关系。其次，另一个瓶颈在于内存：大型语言模型的推理分为两个阶段：Prefill（预填充）阶段与Decode（解码）阶段。前者对输入Token并行处理，计算效率较高；后者逐Token串行生成，天然受制于内存带宽。行业研究机构Clarifai明确指出，解码发生在预填充阶段之后，每次生成一个token；每个token的计算都依赖于之前所有token，因此该阶段是顺序执行且受限于内存。模型会从之前的步骤中检索缓存的键值对，并为每个token添加新的键值对，这意味着限制吞吐量的是内存带宽，而非计算能力。由于模型无法跨token并行处理，GPU核心经常在等待内存读取时处于空闲状态，导致利用率不足。随着上下文窗口增长到8K、16K甚至更大，键值缓存（KV Cache）变得非常庞大，进一步加剧了这一瓶颈。来源：英伟达，国金证券研究所从成本角度看，Token阶梯定价正是这种算力瓶颈的货币化表现。在当前许多大模型厂商都按上下文长度阶梯定价。例如2026年初，谷歌发布的Gemini 3.1 Pro定价：输入token：每百万2.00美元（输入量<= 200K），每百万4.00美元（输入量>200K）。输出token：每百万12.00美元（输入<= 200K），每百万18.00美元（> 200K）。国内阿里云则更是对Qwen模型根据上下文长度分了0-32k，32-128k和128k以上三档定价。 2.2多Agent通信：计算量指数级扩张的另一原因 Agentic AI的另一个主流架构趋势是多Agent协作（Multi-AgentSystems）。Gartner报告显示，从2024年Q1到2025年Q2，多Agent系统的企业询盘量暴增1445%。月之暗面的Kimi k2.5模型就重点推出了Agent集群的能力，它能根据任务需求，现场调度多达100个分身，并行处理1500个步骤。所有的角色分配与任务拆解，无需预设，全由K2.5现场决策。给Kimi Agent集群投喂40篇关于心理学和AI的论文。Kimi先是通过多次调用工具，按顺序把这40篇论文通读一遍，以此确保上下文里完整保留了所有必要信息。紧接着，它衍生出几个子agent，本质上是Kimi的「分身」，分别负责不同章节撰写。最后，主agent负责把关验收，将所有内容汇总生成了一份长达几十页的专业PDF综述。这一架构在提升任务复杂度处理能力的同时，引入了新的算力消耗维度：Agent间通信。Google DeepMind研究团队在2025年12月发表的《Towards a Science of Scaling AgentSystems》中指出，多Agent系统存在固有的通信瓶颈：并行Agent之间必须将全局上下文压缩为Agent间消息传递，产生不可避免的协调税（coordination tax）。 2.3杰文斯悖论：效率提升反而提高算力消耗 AI领域已出现明显的杰文斯悖论——随着模型推理效率的提升，反而刺激使用量以更快速度上升，最终推高总算力消耗。微软CEO纳德拉就表示“随着人工智能变得更加高效和普及，我们将看到它的使用量呈爆炸式增长，使其成为一种我们永远都无法满足的商品。综合分析，我们认为Agent运行时长的增加是技术趋势的必然，在可见的未来，对内存带宽、互联吞吐与智能计算密度的需求，将持续以非线性速率扩张。轮算力基建的加速，是由一条清晰的因果链驱动的结构性通胀： Agent运行时长的增加（Long-Running Agent）→KV Cache线性膨胀与解码阶段吞吐下降→单位Token成本上升→多Agent协作的通信矩阵进一步放大需求规模→杰文斯悖论使单位推理成本下降反而提高总消耗增长→宏观算力资本开支将不断提高。三、投资建议相关标的：海外算力/存储：中际旭创、东山精密、胜宏科技、天孚通信、新易盛、工业富联、兆易创新、大普微、源杰科技、景旺电子、英维克等；Lumentum、闪迪、铠侠、美光、SK海力士、中微公司、北方华创、拓荆科技、长川科技。国内算力：寒武纪、东阳光、海光信息、协创数据、豫能控股、华丰科技、亿田智能、星环科技、网宿科技、首都在线、神州数码、百度集团、大位科技、润建股份、中芯国际、华虹半导体、中科曙光、润泽科技、浪潮信息、东山精密、奥飞数据、云赛智联、瑞晟智能、科华数据、潍柴重机、金山云、欧陆通、杰创智能。 CPU：海光信息、中科曙光、澜起科技、禾盛新材、中国长城、龙芯中科、兴森科技、深南电路、宏和科技、广合科技。 AI应用：1）超级入口：腾讯控股、Minimax、智谱、阿里巴巴、科大讯飞。2）星环科技、德才股份、美年健康、中控技术、卓易信息、昆仑万维等AI INFRA&高增长&高壁垒。其他：空天时代、具身智能等。风险提示行业竞争加剧的风险：在信创等政策持续加码支持计算机行业发展的背景下，众多新兴玩家参与到市场竞争之中，若市场竞争进一步加剧，竞争优势偏弱的企业或面临出清，某些中低端品类的毛利率或受到一定程度影响。技术研发进度不及预期的风险：计算机行业技术开发需投入大量资源，如果相关厂商新品研发进程不及预期，表观层面将呈现出投入产出在较长时期的滞后特征。特定行业下游资本开支周期性波动的风险：部分计算机公司系顺周期行业，下游资本开支波动与行业周期性相关性较强，或在个别年份对于上游软件厂商的营收表现产生扰动。行业投资评级的说明：买入：预期未来3－6个月内该行业上涨幅度超过大盘在15%以上；增持：预期未来3－6个月内该行业上涨幅度超过大盘在5%－15%；中性：预期未来3－6个月内该行业变动幅度相对大盘在-5%－5%；减持：预期未来3－6个月内该行业下跌幅度超过大盘在5%以上。特别声明：国金证券股份有限公司经中国证券监督管理委员会批准，已具备证券投资咨询业务资格。本报告版权归“国金证券股份有限公司”（以下简称“国金证券”）所有，未经事先书面授权，任何机构和个人均不得以任何方式对本报告的任何部分制作任何形式的复制、转发、转载、引用、修改、仿制、刊发，或以任何侵犯本公司版权的其他方式使用。经过书面授权的引用、刊发，需注明出处为“国金证券股份有限公司”，且不得对本报告进行任何有悖原意的删节和修改。本报告的产生基于国金证券及其研究人员认为可信的公开资料或实地调研资料，但国金证券及其研究人员对这些信息的准确性和完整性不作任何保证。本报告反映撰写研究人员的不同设想、见解及分析方法，故本报告所载观点可能与其他类似研究报告的观点及市场实际情况不一致，国金证券不对使用本报告所包含的材料产生的任何直接或间接损失或与此有关的其他任何损失承担任何责任。且本报告中的资料、意见、预测均反映报告初次公开发布时的判断，在不作事先通知的情

点击免费查看完整报告

计算机行业研究：算力再次加速的底层逻辑

计算需求范式跃迁：从Prompt到长Agent

1. 从Prompt到长Agent的变迁

2. Agent上下文长度的结构性增长

3. 长Agent驱动算力需求非线性提升的原因

3.1 大模型架构的天然机制

3.2 多Agent通信开销

3.3 杰文斯悖论效应

4. 投资建议

相关标的

5. 风险提示

你可能感兴趣

算力再加速的底层逻辑掘金AI算力电话会议第30期20260323

计算机周观点第40期：算力与大模型涨价潮，前沿模型加速底层生态整合

国防军工周报（10.1-10.6）：再次重申增配军工的底层逻辑

腾讯云再次发布涨价公告算力通胀逻辑持续演绎中信建投计算机今

国防军工再次重申增配军工的底层逻辑20241008

计算机行业周报：特斯拉自研智能驾驶芯片，AI底层算力竞争白热化

宏观经济深度研究：全球经济秩序变化的底层逻辑

【中泰研究丨晨会聚焦】轻工张潇：存量时代的奢侈品分析框架：分化的底层逻辑

【九点特供】台积电将量产1.3纳米半导体，机构称电子行业正处于“国产算力崛起+半导体设备材料加速替代+供应链涨价预期”三重逻辑交织的..-20260424

市场微观结构研究系列（11）：A股分层效应的普适规律与底层逻辑