行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

Hermes Agent 从入门到精通

信息技术 2026-04-08 Nous Research 陳寧遠

Hermes Agent 核心机制与实践

Part 1: 概念

Hermes Agent 是 Harness Engineering 概念的产品化，首次将五个核心组件（指令层、约束层、反馈层、记忆层、编排层）内建化，实现 Agent 自我改进。
与 OpenClaw 等工具不同，Hermes 强调自改进学习循环，用户控制优先，模型可控，不受内容策略限制。
Hermes 不是替代现有工具，而是递进关系，适合需要 7x24 小时在线、自主运行和持续学习的场景。

Part 2: 核心机制

学习循环：Agent 自我改进的闭环机制，包含策划记忆、创建 Skill、Skill 自改进、FTS5 召回、用户建模五个环节。
三层记忆：情景记忆（会话记忆）、语义记忆（持久记忆）、程序性记忆（Skill 记忆），对应人类的三种记忆类型，支持按需检索，数据本地存储。
Skill 系统：Skill 是 markdown 文件，包含任务描述、执行步骤、注意事项，支持自动创建和自我改进，采用 agentskills.io 标准实现互通。
工具与 MCP：内置 40+ 工具，覆盖通用场景，通过 MCP 接入 6000+ 外部应用，支持stdio和HTTP两种连接方式。
多平台接入：通过 Messaging Gateway 支持 12+ 平台，实现跨平台对话连续性，支持 Telegram、Discord、Slack 等。

Part 3: 动手搭建

提供本地安装、Docker、$5 VPS 三种安装方式，支持 Serverless 方案。
配置文件 config.yaml 包含模型配置、终端后端、网关配置等。
安装配置简单，无需复杂环境依赖，VPS 部署成本低廉。

Part 4: 实战场景

个人知识助手：跨会话记忆显著提升效率，通过 FTS5 按需检索历史信息，Honcho 用户建模提供更精准的用户画像。
开发自动化：结合 GitHub MCP 和 Skill 实现代码审查、测试生成与执行、日报和周报自动汇总，与 Claude Code 形成互补。
内容创作：通过 Skill 积累写作风格和调研习惯，支持子 Agent 并行调研，实现持续性内容项目。
多 Agent 编排：使用 delegate_task 工具实现最多 3 个子 Agent 并行执行，每个子 Agent 拥有独立上下文和工具集，提高效率并保证安全。

Part 5: 深度思考

Hermes、OpenClaw、Claude Code 代表三种不同的设计理念，分别强调自主后台+自改进、配置即行为、交互式编码。
三个工具并非替代关系，而是可以组合使用，根据场景选择合适的工具。
agentskills.io 标准实现 Skill 互通，形成可移植的能力单元，推动 Agent 生态发展。
自改进 Agent 的边界在于反馈信号，需要人定义“更好”的标准，完全放任不管的自改进 Agent 可能会在方向上出错。

关键数据

Hermes Agent v0.7.0 版本，2026 年 4 月发布。
GitHub stars 27000+（发布两个月），首月增长 6000+ stars。
内置 40+ 工具，支持 12+ 平台，MCP 可接入 6000+ 应用。
子 Agent 并发最多 3 个，最低部署成本 $5/月 VPS。

研究结论

Hermes Agent 通过自改进学习循环、三层记忆、Skill 系统等机制，实现 Agent 自主学习和进化，提升效率并降低使用门槛。
多平台接入和 MCP 集成扩展了 Agent 的应用场景，使其能够适应各种工作流。
自改进 Agent 的价值在于其自主性，但需要人定义方向和标准，完全放任不管的自改进 Agent 可能存在风险。
未来 Agent 生态将呈现工具组合的趋势，agentskills.io 标准将推动 Skill 互通，形成更丰富的应用生态。

Hermes Agent从入门到精通第一个出厂就带缰绳的AI AgentNous Research开源框架实战指南 TheAgentThatGrowsWithYou 关键词：自改进Agent ·跨会话记忆· Skill系统· MCP ·多平台适合读者：想搭建个人AI Agent的开发者和AI爱好者版本：v260407 花叔公众号「花叔」· B站「AI进化论-花生」本手册基于Hermes Agent v0.7.0编写。AI工具迭代迅速，部分内容可能随版本更新而变化，请以官方文档为准。目录 CONTENTS Part 1:概念 §16Hermes vs OpenClaw vs Claude Code：不是选择题 §17自改进Agent的边界：它能走多远 §01不是又一个Agent：从Harness到Hermes NotAnotherAgent:FromHarnesstoHermes OpenClaw热潮还没散，Hermes Agent就来了。它不是「又一个Agent工具」，而是Harness Engineering概念的第一次产品化。又来一个？我理解你的疲惫。 OpenClaw在2025年底掀起了龙虾热。2600万用户，国内大厂纷纷跟进做自己的龙虾类产品。那段时间你的朋友圈大概率被「我养了一只虾」刷过屏。龙虾热还没完全散去，又有一个新东西冒出来了。 2026年2月，Nous Research发布了Hermes Agent。两个月不到，GitHub stars飙到27000+。你的第一反应可能是：龙虾我还没搞明白，又来？我花了一周时间把Hermes从头到尾拆了一遍，发现它和OpenClaw走的是完全不同的路。Hermes不是又一个龙虾，它在做一件我们一直在讨论但没人做成产品的事。 Harness Engineering是什么如果你读过上一本橙皮书《Harness Engineering》，这部分可以跳过。没读过的话，30秒讲清楚。 2026年初，AI编程圈出现了一个共识：瓶颈不是模型，是环境。LangChain团队做了一个实验，用同一个模型（GPT-5.2-Codex），只调整周围的「缰绳」配置，成绩从52.8%涨到66.5%，排名从Top 30跳到Top 5。模型一行没改。 Mitchell Hashimoto（Terraform的创造者）第一个给这件事命名：Harness Engineering。他的做法很朴素，每次AI犯错，就加一条规则，让它永远不再犯同一个错。文件是活的，一直在长。我在那本书里把Harness拆成了五个组件。这五个组件，是理解Hermes的钥匙。五组件映射 Harness Engineering讲的是方法论，是「你应该给AI造什么样的缰绳」。但方法论有一个问题：执行全靠人。你得自己写CLAUDE.md，自己配hooks，自己搭记忆系统，自己设计工作流。 Hermes做的事情是：把这五个组件全部内建了。看左列和右列的对比。左边全是手动操作，你得是一个有经验的工程师才能搭出来。右边是开箱即用，装完就有。这就是Hermes和OpenClaw的本质区别。OpenClaw给你一套配置即行为的系统，你写SOUL.md，它变成你想要的样子。它的记忆系统功能完善（Daily Logs + MEMORY.md +语义搜索），Skill生态庞大，但主要靠人工编写和维护。Hermes把这五个维度全部内建了，而且让它们自动运转。概念连接：如果你用过Claude Code的CLAUDE.md + hooks + memory，你已经在手动实现Harness了。Hermes做的事情是把这套手动流程变成了一个自动运行的系统。从「你给AI造缰绳」变成「AI自己给自己造缰绳」。 Nous Research为什么做这件事做Hermes Agent的不是大公司，是一个开源AI研究实验室。 Nous Research在AI圈被形容为「开源社区中的神秘力量」。核心人物Teknium主导微调和数据集策划，早期靠RedmondAI提供算力支持，团队规模一直不大。但他们做出来的Hermes模型家族（从8B到Hermes 4的14B/70B/405B），纯靠后训练就达到了前沿水平。不需要从头预训练，不需要巨额算力预算。这个理念延续到了Hermes Agent上：用开源工具+任意LLM API，个人也能部署媲美商业方案的AI Agent。MIT许可证，完全开源。他们的核心原则挺鲜明的。用户控制优先，模型是可控的（steerable），你可以按需调整行为，不受企业内容策略限制。审查这事儿他们明确不做，声明模型是「unencumbered by censorship, neutrally aligned」。同时在创造力和数学、编码、推理性能上都不妥协。这些原则决定了Hermes Agent的设计取向：不是替你做决定，而是你设规则、它学规则、然后越做越好。控制权始终在用户手里，执行的复杂度由系统承担。不是替代，是递进有一个常见的误解：Hermes要取代Claude Code或OpenClaw。其实不是，这三个工具解决的是不同层面的问题。 Claude Code做交互式编码。你坐在终端前，和它来回对话，实时协作。它是你的结对工程师。 OpenClaw做配置即行为。你写一个SOUL.md，它就变成你想要的样子。配置透明，生态成熟，ClawHub有44000+社区Skill。 Hermes做自主后台+自改进。你不需要坐在它旁边。它自己跑，自己学，自己进化。24/7在线，通过Telegram或Discord随时可达。一个有意思的点是，这三个工具都采用agentskills.io标准，Skill可以互通。你在Claude Code里写的Skill，Hermes也能用，反过来也一样。它们不是三条平行线，更像是一个生态里分工不同的三个角色。核心建议如果你只是写代码，Claude Code够用了。如果你想要一个7x24小时帮你看守任务、会自己变聪明的后台Agent，那就该看Hermes了。出厂就带缰绳回到开头的问题：为什么这一次不一样？龙虾热教会了普通人一件事：AI可以是「你养出来的」，不是「你打开就用的」。OpenClaw的SOUL.md、记忆系统、个性化配置，让人第一次体验到什么叫「我的AI」。但养虾的人也发现了一个问题：缰绳全得自己造。写SOUL.md，手动调技能，定期清理记忆。龙虾越用越好用，前提是你愿意花时间喂它。 Hermes的思路不同：把缰绳直接焊进出厂设置，而且让缰绳自己长大。你第一次和Hermes对话，它就开始自动写入记忆、自动提炼Skill、自动优化工作流。用的时间越长，它对你的理解越深，做事的质量越高。不是你在训练它，是它在训练自己。 Hermes是第一个出厂就带缰绳的Agent。而且缰绳会自己长大。 §02Hermes Agent全景：60秒看懂 HermesAgentataGlance: 60Seconds 一张流程图、一组数据、一张对比表。看完这三样，你就知道Hermes是怎么回事了。架构一张图 Hermes Agent的架构可以用一条线串起来：从左到右，每个模块的职责一句话讲清楚：学习循环是Hermes的心脏。每次完成一个任务，它会自动复盘：该记住什么、该提炼什么Skill、现有Skill需不需要优化。这个循环是持续运转的，不需要你手动触发。三层记忆是Hermes的大脑。会话记忆记住「刚才发生了什么」，持久记忆记住「你是谁、你喜欢什么」，Skill记忆记住「怎么做事」。三层各司其职，用SQLite + FTS5索引存储，按需检索而不是全量加载。 Skill系统是Hermes的技能库。每个Skill是一个独立的markdown文件，存在~/.hermes/skills/目录下。来源有三种：仓库自带的、Agent自己创建的、从社区Hub安装的。关键特性：Skill不是静态的，会在使用中自我改进。 40+内置工具是Hermes的手脚。分五大类：执行（跑代码、操作文件）、信息（搜索、抓取）、媒体（图片、视频）、记忆（读写存储）、协调（子Agent委派）。再加上MCP集成，可以连接6000+外部应用。多平台Gateway是Hermes的入口。Telegram、Discord、Slack、WhatsApp、Signal、CLI，12+平台支持。你可以在Telegram上给它发消息，它在VPS后台处理，跨平台对话连续。关键数据 v0.7.0版本，2026年4月3日发布。几个数字值得记一下：两个月27000+ stars，这个增速很快。要知道OpenClaw靠龙虾热加持才有今天的体量。Hermes在没有类似社交传播效应的情况下达到这个数字，说明开发者社区确实觉得它解决了一个真实的问题。和OpenClaw的关键区别龙虾热之后，大家最关心的问题是：Hermes和OpenClaw到底有什么不一样？差距最大的两个维度是学习能力和用户建模。OpenClaw的Skill主要靠人工编写和调整，它的进化依赖社区和用户的主动维护。Hermes用的越久，Skill越精准，记忆越深，做事越顺手。但OpenClaw也有Hermes比不了的地方：生态成熟度。ClawHub上44000+社区Skill，各种场景都有现成方案。Hermes的社区还在早期阶段。2600万用户的龙虾热给OpenClaw带来了巨大的网络效应，这不是技术能弥补的。一句话区分：OpenClaw是你养出来的龙虾，Hermes是自己会长大的龙虾。一个靠你用心喂养，一个靠自己从经验中学习。 $5就能跑起来成本是很多人关心的。答案可能会让你意外。 Hermes本身免费，MIT开源。你只需要付LLM API的调用费。部署成本取决于你选什么方案：最省钱：随便一台$5/月的VPS（Hetzner CX22大概$4/月，DigitalOcean、Vultr都行），Ubuntu 22.04，不跑本地LLM的话内存占用不到500MB。配合OpenRouter走Claude Haiku或DeepSeek，API费用也很低。更省钱：Serverless方案。用Daytona或Modal做后端，空闲时环境休眠，收到消息时自动唤醒。会话间成本几乎为零。注重隐私：在VPS上跑Ollama，本地运行8B或70B的开源模型。API费用为零，但需要更大的VPS（建议16GB以上内存）。不管哪种方案，$5 VPS + Telegram Bot就能搭出一个24/7在线的个人AI Agent。这个性价比，比订阅制的商业Agent方案划算太多了。核心建议对比一下：Claude Code的Pro订阅$20/月，Max订阅$200/月。Hermes的$5 VPS + API费方案，大部分使用场景下月成本在$10以内。当然两者定位不同，不能直接比价格，但成本门槛确实低很多。它适合谁最后一个问题：这本书适合你吗？满足以下任意一条，就接着看：你用过Claude Code或OpenClaw，想要一个能自主跑后台任务的Agent。不是你坐在旁边盯着的那种，是你睡觉它也在干活的那种。你对Harness Engineering有了解，好奇这套方法论被产品化之后是什么样子。你想在自己的VPS上部署一个私有AI Agent，数据不离开自己的服务器。你单纯好奇一个两个月拿到27000+ stars的开源项目，到底做对了什么。接下来的章节，我们从学习循环开始，一层一层拆开Hermes的核心机制。 §03学习循环：Agent自己给自己造缰绳 TheLearningLoop:Self-HarnessingAgent Hermes Agent最让人意外的不是它能做什么，而是它会变。用得越多，它越

点击免费查看完整报告

Hermes Agent 从入门到精通

Hermes Agent 核心机制与实践

Part 1: 概念

Part 2: 核心机制

Part 3: 动手搭建

Part 4: 实战场景

Part 5: 深度思考

关键数据

研究结论

你可能感兴趣

基木鱼之声 | 营销通微信组件，从入门到精通

DeepSeek：从入门到精通

2025年DeepSeek 7大场景+50大案例+全套提示词从入门到精通干货

碳酸锂专题报告：碳酸锂投研框架从入门到精通

ChatGPT从入门到精通

WhatsApp商业平台从入门到精通指南

OpenClaw从入门到精通指南

OpenClaw橙皮书：从入门到精通

OpenClaw从入门到精通指南

DeepSeek指导手册-从入门到精通

Hermes Agent 从入门到精通

你可能感兴趣

基木鱼之声 | 营销通微信组件，从入门到精通

DeepSeek：从入门到精通

2025年DeepSeek 7大场景+50大案例+全套提示词 从入门到精通干货

碳酸锂专题报告：碳酸锂投研框架 从入门到精通

ChatGPT从入门到精通

WhatsApp商业平台从入门到精通指南

OpenClaw从入门到精通指南

OpenClaw橙皮书：从入门到精通

OpenClaw从入门到精通指南

DeepSeek指导手册-从入门到精通

2025年DeepSeek 7大场景+50大案例+全套提示词从入门到精通干货

碳酸锂专题报告：碳酸锂投研框架从入门到精通