Hermes Agent从入门到精通 第一个出厂就带缰绳的AI AgentNous Research开源框架实战指南 TheAgentThatGrowsWithYou 关键词:自改进Agent ·跨会话记忆· Skill系统· MCP ·多平台适合读者:想搭建个人AI Agent的开发者和AI爱好者版本:v260407 花叔 公众号「花叔」· B站「AI进化论-花生」 本手册基于Hermes Agent v0.7.0编写。AI工具迭代迅速,部分内容可能随版本更新而变化,请以官方文档为准。 目录 CONTENTS Part 1:概念 §16Hermes vs OpenClaw vs Claude Code:不是选择题 §17自改进Agent的边界:它能走多远 §01不是又一个Agent:从Harness到Hermes NotAnotherAgent:FromHarnesstoHermes OpenClaw热潮还没散,Hermes Agent就来了。它不是「又一个Agent工具」,而是Harness Engineering概念的第一次产品化。 又来一个? 我理解你的疲惫。 OpenClaw在2025年底掀起了龙虾热。2600万用户,国内大厂纷纷跟进做自己的龙虾类产品。那段时间你的朋友圈大概率被「我养了一只虾」刷过屏。龙虾热还没完全散去,又有一个新东西冒出来了。 2026年2月,Nous Research发布了Hermes Agent。两个月不到,GitHub stars飙到27000+。 你的第一反应可能是:龙虾我还没搞明白,又来? 我花了一周时间把Hermes从头到尾拆了一遍,发现它和OpenClaw走的是完全不同的路。Hermes不是又一个龙虾,它在做一件我们一直在讨论但没人做成产品的事。 Harness Engineering是什么 如果你读过上一本橙皮书《Harness Engineering》,这部分可以跳过。没读过的话,30秒讲清楚。 2026年初,AI编程圈出现了一个共识:瓶颈不是模型,是环境。LangChain团队做了一个实验,用同一个模型(GPT-5.2-Codex),只调整周围的「缰绳」配置,成绩从52.8%涨到66.5%,排名从Top 30跳到Top 5。模型一行没改。 Mitchell Hashimoto(Terraform的创造者)第一个给这件事命名:Harness Engineering。他的做法很朴素,每次AI犯错,就加一条规则,让它永远不再犯同一个错。文件是活的,一直在长。 我在那本书里把Harness拆成了五个组件。这五个组件,是理解Hermes的钥匙。 五组件映射 Harness Engineering讲的是方法论,是「你应该给AI造什么样的缰绳」。但方法论有一个问题:执行全靠人。你得自己写CLAUDE.md,自己配hooks,自己搭记忆系统,自己设计工作流。 Hermes做的事情是:把这五个组件全部内建了。 看左列和右列的对比。左边全是手动操作,你得是一个有经验的工程师才能搭出来。右边是开箱即用,装完就有。 这就是Hermes和OpenClaw的本质区别。OpenClaw给你一套配置即行为的系统,你写SOUL.md,它变成你想要的样子。它的记忆系统功能完善(Daily Logs + MEMORY.md +语义搜索),Skill生态庞大,但主要靠人工编写和维护。Hermes把这五个维度全部内建了,而且让它们自动运转。 概念连接:如果你用过Claude Code的CLAUDE.md + hooks + memory,你已经在手动实现Harness了。Hermes做的事情是把这套手动流程变成了一个自动运行的系统。从「你给AI造缰绳」变成「AI自己给自己造缰绳」。 Nous Research为什么做这件事 做Hermes Agent的不是大公司,是一个开源AI研究实验室。 Nous Research在AI圈被形容为「开源社区中的神秘力量」。核心人物Teknium主导微调和数据集策划,早期靠RedmondAI提供算力支持,团队规模一直不大。但他们做出来的Hermes模型家族(从8B到Hermes 4的14B/70B/405B),纯靠后训练就达到了前沿水平。不需要从头预训练,不需要巨额算力预算。 这个理念延续到了Hermes Agent上:用开源工具+任意LLM API,个人也能部署媲美商业方案的AI Agent。MIT许可证,完全开源。 他们的核心原则挺鲜明的。用户控制优先,模型是可控的(steerable),你可以按需调整行为,不受企业内容策略限制。审查这事儿他们明确不做,声明模型是「unencumbered by censorship, neutrally aligned」。同时在创造力和数学、编码、推理性能上都不妥协。 这些原则决定了Hermes Agent的设计取向:不是替你做决定,而是你设规则、它学规则、然后越做越好。控制权始终在用户手里,执行的复杂度由系统承担。 不是替代,是递进 有一个常见的误解:Hermes要取代Claude Code或OpenClaw。其实不是,这三个工具解决的是不同层面的问题。 Claude Code做交互式编码。你坐在终端前,和它来回对话,实时协作。它是你的结对工程师。 OpenClaw做配置即行为。你写一个SOUL.md,它就变成你想要的样子。配置透明,生态成熟,ClawHub有44000+社区Skill。 Hermes做自主后台+自改进。你不需要坐在它旁边。它自己跑,自己学,自己进化。24/7在线,通过Telegram或Discord随时可达。 一个有意思的点是,这三个工具都采用agentskills.io标准,Skill可以互通。你在Claude Code里写的Skill,Hermes也能用,反过来也一样。它们不是三条平行线,更像是一个生态里分工不同的三个角色。 核心建议 如果你只是写代码,Claude Code够用了。如果你想要一个7x24小时帮你看守任务、会自己变聪明的后台Agent,那就该看Hermes了。 出厂就带缰绳 回到开头的问题:为什么这一次不一样? 龙虾热教会了普通人一件事:AI可以是「你养出来的」,不是「你打开就用的」。OpenClaw的SOUL.md、记忆系统、个性化配置,让人第一次体验到什么叫「我的AI」。 但养虾的人也发现了一个问题:缰绳全得自己造。写SOUL.md,手动调技能,定期清理记忆。龙虾越用越好用,前提是你愿意花时间喂它。 Hermes的思路不同:把缰绳直接焊进出厂设置,而且让缰绳自己长大。 你第一次和Hermes对话,它就开始自动写入记忆、自动提炼Skill、自动优化工作流。用的时间越长,它对你的理解越深,做事的质量越高。不是你在训练它,是它在训练自己。 Hermes是第一个出厂就带缰绳的Agent。而且缰绳会自己长大。 §02Hermes Agent全景:60秒看懂 HermesAgentataGlance: 60Seconds 一张流程图、一组数据、一张对比表。看完这三样,你就知道Hermes是怎么回事了。 架构一张图 Hermes Agent的架构可以用一条线串起来: 从左到右,每个模块的职责一句话讲清楚: 学习循环是Hermes的心脏。每次完成一个任务,它会自动复盘:该记住什么、该提炼什么Skill、现有Skill需不需要优化。这个循环是持续运转的,不需要你手动触发。 三层记忆是Hermes的大脑。会话记忆记住「刚才发生了什么」,持久记忆记住「你是谁、你喜欢什么」,Skill记忆记住「怎么做事」。三层各司其职,用SQLite + FTS5索引存储,按需检索而不是全量加载。 Skill系统是Hermes的技能库。每个Skill是一个独立的markdown文件,存在~/.hermes/skills/目录下。来源有三种:仓库自带的、Agent自己创建的、从社区Hub安装的。关键特性:Skill不是静态的,会在使用中自我改进。 40+内置工具是Hermes的手脚。分五大类:执行(跑代码、操作文件)、信息(搜索、抓取)、媒体(图片、视频)、记忆(读写存储)、协调(子Agent委派)。再加上MCP集成,可以连接6000+外部应用。 多平台Gateway是Hermes的入口。Telegram、Discord、Slack、WhatsApp、Signal、CLI,12+平台支持。你可以在Telegram上给它发消息,它在VPS后台处理,跨平台对话连续。 关键数据 v0.7.0版本,2026年4月3日发布。几个数字值得记一下: 两个月27000+ stars,这个增速很快。要知道OpenClaw靠龙虾热加持才有今天的体量。Hermes在没有类似社交传播效应的情况下达到这个数字,说明开发者社区确实觉得它解决了一个真实的问题。 和OpenClaw的关键区别 龙虾热之后,大家最关心的问题是:Hermes和OpenClaw到底有什么不一样? 差距最大的两个维度是学习能力和用户建模。OpenClaw的Skill主要靠人工编写和调整,它的进化依赖社区和用户的主动维护。Hermes用的越久,Skill越精准,记忆越深,做事越顺手。 但OpenClaw也有Hermes比不了的地方:生态成熟度。ClawHub上44000+社区Skill,各种场景都有现成方案。Hermes的社区还在早期阶段。2600万用户的龙虾热给OpenClaw带来了巨大的网络效应,这不是技术能弥补的。 一句话区分:OpenClaw是你养出来的龙虾,Hermes是自己会长大的龙虾。一个靠你用心喂养,一个靠自己从经验中学习。 $5就能跑起来 成本是很多人关心的。答案可能会让你意外。 Hermes本身免费,MIT开源。你只需要付LLM API的调用费。部署成本取决于你选什么方案: 最省钱:随便一台$5/月的VPS(Hetzner CX22大概$4/月,DigitalOcean、Vultr都行),Ubuntu 22.04,不跑本地LLM的话内存占用不到500MB。配合OpenRouter走Claude Haiku或DeepSeek,API费用也很低。 更省钱:Serverless方案。用Daytona或Modal做后端,空闲时环境休眠,收到消息时自动唤醒。会话间成本几乎为零。 注重隐私:在VPS上跑Ollama,本地运行8B或70B的开源模型。API费用为零,但需要更大的VPS(建议16GB以上内存)。 不管哪种方案,$5 VPS + Telegram Bot就能搭出一个24/7在线的个人AI Agent。这个性价比,比订阅制的商业Agent方案划算太多了。 核心建议 对比一下:Claude Code的Pro订阅$20/月,Max订阅$200/月。Hermes的$5 VPS + API费方案,大部分使用场景下月成本在$10以内。当然两者定位不同,不能直接比价格,但成本门槛确实低很多。 它适合谁 最后一个问题:这本书适合你吗? 满足以下任意一条,就接着看: 你用过Claude Code或OpenClaw,想要一个能自主跑后台任务的Agent。不是你坐在旁边盯着的那种,是你睡觉它也在干活的那种。 你对Harness Engineering有了解,好奇这套方法论被产品化之后是什么样子。 你想在自己的VPS上部署一个私有AI Agent,数据不离开自己的服务器。 你单纯好奇一个两个月拿到27000+ stars的开源项目,到底做对了什么。 接下来的章节,我们从学习循环开始,一层一层拆开Hermes的核心机制。 §03学习循环:Agent自己给自己造缰绳 TheLearningLoop:Self-HarnessingAgent Hermes Agent最让人意外的不是它能做什么,而是它会变。用得越多,它越