行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

国金计算机科技GLM5技术解析国产模型进入算力换效果阶段Token消耗

2026-02-24 未知机构 carry~强

参数规模与性能提升：GLM-5总参数量翻倍至744B（激活参数40B），相比GLM-4.5（355B/32B）实现大幅扩容；核心基准测试平均提升约20%，综合实力比肩Claude Opus 4.5与GPT-5.2；SWE-bench Verified得分77.8%，BrowseComp得分75.9%。
技术优化与成本控制：采用DSA稀疏注意力架构，长序列处理时GPU注意力算力成本降低50%；适配国产芯片生态，W4A8量化策略使单节点性能媲美国际双GPU集群，长序列部署成本削减50%。
创新机制与算力换效果：引入“交替思考”（Interleaved Thinking）模式，每次回复和工具调用前进行深度推理，通过长前缀预填充实现算力指数级提升，印证“算力换效果”阶段。
应用场景与能力跃迁：推动AI从被动代码生成向“Agentic Engineering”转变，CC-Bench-V2测试展现端到端处理能力；Token调用成本降低使国产模型能力从“抽卡”提升至“工业化可用”，后续受益于Token放量与出海。

【#参数规模翻倍、Agentic能力大跃升】GLM-5总参数量翻倍扩张至744B（激活参数40B），相比前代GLM-4.5的355B（激活参数32B）实现了大幅扩容。同时，GLM-5在各项核心基准测试平均提升约20%，综合实力比肩Claude Opus 4.5与GPT-5.2。在SWE 【国金计算机&科技】GLM5技术解析：国产模型进入算力换效果阶段，Token消耗指数级提升！【#参数规模翻倍、Agentic能力大跃升】GLM-5总参数量翻倍扩张至744B（激活参数40B），相比前代GLM-4.5的355B（激活参数32B）实现了大幅扩容。同时，GLM-5在各项核心基准测试平均提升约20%，综合实力比肩Claude Opus 4.5与GPT-5.2。在SWE-bench Verified测试中得分达到77.8%，BrowseComp得分75.9%。【GLM-5采用DSA稀疏注意力架构，在处理长序列时直接将GPU注意力算力成本降低了一半。此外，模型深度适配国产芯片生态，通过极致的W4A8量化策略，在单台节点即可媲美国际双GPU集群，并将长序列场景下的部署成本大幅削减50%。【#“交替思考”模式、国产模型进入算力换效果阶段】GLM5引入了“交替思考”（Interleaved Thinking），在每次回复和调用工具前进行深度推理。 ##正如我们在年度策略《两仪生四象，超级时代》中所强调，Interleaved Thinking会带来海量的长前缀预填充，从而带来算力的指数级提升【#VibeCoding向VibeAgent转变】GLM-5致力于推动Al从被动的代码生成向自主规划、迭代的“Agentic Engineering”转变。在内部真实场景测试集CC-Bench-V2中展现了出色的端到端处理能力；#综合参考Openrouter的Token调用看、我们认为：国产模型能力的下限从“抽卡”到“工业化可用”，达到了Coding、Agent稳定可用的要求，后续受益于Token放量+出海。

点击免费查看完整报告

国金计算机科技GLM5技术解析国产模型进入算力换效果阶段Token消耗

你可能感兴趣

国金计算机科技Qwen3更新国产模型进入Agent时代海外2025重演

从技术演进到算力消耗估算，深度拆解AIAgent：AI进入Token时代，MCP赋能Agent迈向泛智能

国联民生计算机Token通胀模型端优化有望提振国产算力需求继续看好

【财联社早知道】Token调用总量已超过上一代模型10倍，腾讯AI战略全面提速，机构称Token消耗规模将长期保持高增态势，这家公司已构建超330个节点机房的分布式算力网络，可运营算力规模达5.3万路-20260514

智谱GLM5有望成为企业端最好的国产基座模型中信证券计算机

【电报解读】豆包将推出付费订阅版本！AI大模型从“对话时代”进入“智能体时代”下，Token消耗激增，推理算力需求或将呈“指数级”增长，这家公司产品在电源类新场景应用中已取-20260506

港股科技行业点评报告：主权AI及token消耗强化中长期算力需求的持续性，传统AI标的亦有望受益

【电报解读】DeepSeek上线识图模式！机构称V4开源是国产算力生态走向规模商业化的关键拐点，有望驱动“模型更强→用户更多→Token更旺→国产算力更快迭代”的正反馈循环，这家公-20260430

计算机行业周报：Token经济引燃算力需求，国产算力链有望迎来拐点

华创计算机国产GPU主线强势回归Token经济学驱动国产算力卡需求大