行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

GPT54发布点评知识工作与计算机操作能力大幅提升高推理成本为核心痛点

2026-03-09 未知机构 carry~强

GPT-5.4发布点评：知识工作与计算机操作能力大幅提升，高推理成本为核心痛点

产品发布

OpenAI于北京时间3月6日凌晨发布GPT-5.4系列模型，包含GPT-5.4 Thinking和GPT-5.4 Pro。该系列模型整合了编程、推理、计算机操控、网页搜索和百万Token上下文功能，并在编程、推理、计算机操控和网页搜索等方面取得显著进步。GPT-5.4的上下文长度达到100万token，目前已在ChatGPT、API和Codex中推出。

模型亮点

知识工作场景能力大幅提升：
- 投行内部电子表格建模测试中，GPT-5.4平均得分87.3%（GPT-5.2为68.4%）。
- 大型律所法律评估测试中，GPT-5.4得分为91%。
计算机操作能力：
- 作为OpenAI首个具备原生计算机使用功能的通用模型，擅长通过代码操作计算机并发出鼠标和键盘命令。
- OSWorld-Verified电脑操作测试中，GPT-5.4得分达SOTA（75.0%），超越人类平均水平（72.4%）。
- WebArena-Verified浏览器测试中，GPT-5.4得分67.3%。
- BrowseComp网页搜索基准上，GPT-5.4得分82.7%（Pro版达89.3%，创业界最高分）。

模型痛点

高推理成本：
- GPT-5.4 API标准版定价：输入2.50美元/百万Token，缓存输入0.25美元/百万Token，输出15美元/百万Token。
- GPT-5.4 Pro版定价：输入30美元/百万Token，输出180美元/百万Token。
- 对比其他模型：
  - 谷歌Gemini 3.1 Pro Preview：输入2美元/百万Token，输出12美元/百万Token。
  - Anthropic Claude Opus4.6：输入5美元/百万Token，输出25美元/百万Token。

【产品发布】北京时间3月6日凌晨，OpenAI发布GPT-5.4 该系列模型包含GPT-5.4 Thinking和GPT-5.4 Pro。该款模型将编程、推理、计算机操控、网页搜索和百万Token上下文全部整合进同一个模型。 GPT-5.4发布点评：知识工作与计算机操作能力大幅提升，高推理成本为核心痛点【中信证券前瞻】—————- 【产品发布】北京时间3月6日凌晨，OpenAI发布GPT-5.4 系列模型。该系列模型包含GPT-5.4 Thinking和GPT-5.4 Pro。该款模型将编程、推理、计算机操控、网页搜索和百万Token上下文全部整合进同一个模型。根据OpenAI官网，GPT-5.4的上下文长度达到了100万token，在编程、推理、计算机操控和网页搜索等方面均取得良好进步。目前GPT-5.4 Thinking和GPT-5.4 Por已经在ChatGPT中推出。 API和Codex中也已经可以调用GPT-5.4。【模型亮点】GPT-5.4 在知识工作场景中能力大幅提升，展示出较好的可用性。譬如，在投行内部电子表格建模测试中，GPT-5.4的平均得分达到了87.3%（GPT-5.2为68.4%）；在大型律所法律评估测试中，GPT-5.4得分为91%。而在计算机操作能力上，GPT-5.4作为OpenAI首个具备原生计算机使用功能的通用模型，擅长通过使用编写代码来操作计算机，并能根据截图发出鼠标和键盘命令。在电脑操作测试OSWorld-Verified中，GPT-5.4得分达SOTA（75.0%），该结果已超越人类平均水平（72.4%）；在浏览器测试WebArena-Verified中GPT-5.4的得分达到了67.3%；在网页搜索中，GPT-5.4在BrowseComp基准上得分82.7%，比GPT-5.2的65.8%高出17个百分点，Pro版更达到89.3%，创下业界最高分。【模型痛点】我们认为该模型的痛点在于高推理成本。根据OpenAI官网，GPT-5.4 API标准版定价为输入2.50美元/百万Token，缓存输入0.25美元/百万Token，输出15美元/百万Token；Pro版为输入30美元/百万Token，输出180美元/百万Token。而谷歌推出的Gemini 3.1 Pro Preview为输入2美元/百万Token，输出12美元/百万Token；Anthropic推出的Claude Opus4.6为输入5美元/百万Token，输出25美元/百万Token。

点击免费查看完整报告

GPT54发布点评知识工作与计算机操作能力大幅提升高推理成本为核心痛点

GPT-5.4发布点评：知识工作与计算机操作能力大幅提升，高推理成本为核心痛点

产品发布

模型亮点

模型痛点

你可能感兴趣

计算机行业零售技术Retail Tech主题双周报2018年第4期：社区新零售颠覆传统业态，Retail Tech解决核心痛点

公司信息更新报告：核心痛点“避障”能力大幅提升，盈利能力有望再升

全球科技（计算机）行业周报：DeepSeek-V3.2-Exp发布，训练推理提效，API同步降价

西部计算机DeepSeek发布创新注意力机制NSA推理速度大幅提高

电子行业先进科技主题周报：周观点，海外大厂发布Q4财报，DeepSeek降低训练与推理成本

电子行业先进科技主题周报-周观点：海外大厂发布Q4财报，DeepSeek降低训练与推理成本

高频因子跟踪：ChatGPTo3模型最新发布，推理与编程能力大幅提升

计算机行业点评：美国首个全球AI禁令发布，关注国产推理算力产业链

计算机行业点评报告：英伟达：重视AI推理计算，发布Rubin CPX芯片

计算机行业点评报告：英伟达（NVDA.O）：重视AI推理计算，发布RubinCPX芯片