一句话总结
Hermes Agent 是 Nous Research 开源的自我进化个人 AI 智能体:它不只是执行任务,更会从任务中学习 —— 自动创建技能、跨会话记忆、越用越聪明,是目前最接近"永久在线、持续成长"理想的开源 Agent。
项目基本信息
| 项目 | 详情 |
|---|---|
| 作者 | Nous Research(Hermes 模型系列的同一团队) |
| GitHub | NousResearch/hermes-agent |
| 官网文档 | hermes-agent.nousresearch.com |
| 许可证 | MIT |
| Stars | 38,700+(截至 2026 年 4 月) |
| 最新版本 | v0.8.0 (v2026.4.8) —— "The Intelligence Release" |
| 核心口号 | The Agent That Grows With You(与你一同成长的 Agent) |
| 安装 | curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash |
| 支持平台 | Linux、macOS、WSL2、Android (Termux) |
它和普通 Agent 有什么根本区别?
绝大多数 Agent 框架的工作方式是:
Hermes 在执行结束后,多了一个关键步骤:
核心差异: Hermes 不是在重复使用同一个"大脑",而是在不断扩充这个大脑的经验库。
四层记忆架构
Hermes 的记忆系统是其最核心的创新,分为四个层次:
Layer 1:系统提示记忆(总是在线)
- 存储在
~/.hermes/memories/中的MEMORY.md和USER.md - 每次会话开始时自动注入到系统提示
- Agent 通过 memory 工具自主管理(增删改)
- 有字符限制:记忆区约 2200 字符,用户区约 1375 字符
- 满了就自动整合,保持聚焦
Layer 2:技能记忆(经验结晶)
- 完成复杂任务后,Agent 自动将成功的方法写成技能文档(Markdown)
- 存储在
~/.hermes/skills/ - 技能可搜索、可复用、会自我改进
- 下次遇到相似问题直接调用已有技能,无需重新摸索
Layer 3:会话搜索(长期回忆)
- 所有 CLI 和消息平台会话存入 SQLite(
~/.hermes/state.db) - 使用 FTS5 全文检索,配合 Gemini Flash 对结果进行摘要
- Agent 按需调用
session_search工具,不占用常驻上下文
Layer 4:外部记忆提供商(可扩展)
- 推荐:Hindsight(结构化知识提取 + 实体解析 + 反思综合,本地运行,零成本)
- 可选:Honcho(用户建模)
- 在 LongMemEval 基准测试中,Hindsight 是所有提供商中得分最高的
技能系统(Skills System)
技能 vs. 工具
| 工具(Tools) | 技能(Skills) |
|---|---|
| Agent 能调用的单个能力 | Agent 知道如何用工具做事的知识 |
| 如:运行终端命令、搜索网络 | 如:把多个工具调用链接成完整工作流 |
| 固定的、内置的 | 动态生成的、随使用改进的 |
技能的三级渐进加载
- Level 0:只加载技能名称和描述(~3K tokens,支持 40+ 技能)
- Level 1:按需加载完整 SKILL.md 内容
- Level 2:加载具体参考文件
Agent 只在需要时拉取所需层级,保持上下文精简。
技能的可移植性
- 与 agentskills.io 兼容,社区共享技能库
- 支持平台限制和条件加载(如:没有 Firecrawl API key 时自动 fallback 到 DuckDuckGo 搜索)
核心架构内部
系统提示构建(prompt_builder.py)
每次会话的系统提示由以下内容组装:
工具注册表(tools/registry.py)
- 47 个注册工具,分布在 20 个工具集
- 每个工具文件在导入时自动注册
- 统一处理:schema 收集、分发、可用性检查、错误包装
会话持久化
- SQLite(WAL 模式):支持并发读,单写者
- 每轮对话后写入:会话内容、工具调用、执行结果
- 原始记录存入 JSONL 文件
- Cron 定义单独存储在磁盘
上下文压缩的记忆安全机制
对话变长需要压缩时,Hermes 先触发记忆刷新:
- 独立调用模型,只提供 memory 工具
- 给 Agent 机会在压缩前保存重要信息
- 压缩后,未被标记的内容彻底消失
平台与部署灵活性
支持的消息平台(一个 Gateway 进程管理全部)
Telegram、Discord、Slack、WhatsApp、Signal、Matrix、Email、Mattermost + CLI
支持的终端后端(6 种)
| 后端 | 特点 |
|---|---|
| Local | 本地直接运行 |
| Docker | 容器隔离 |
| SSH | 远程服务器 |
| Daytona | 无服务器持久化,空闲时休眠 |
| Singularity | HPC 环境 |
| Modal | 无服务器持久化,按需唤醒 |
模型无关性
可接入任意模型,一行命令切换,无需改代码:
支持:Nous Portal、OpenRouter(200+ 模型)、OpenAI、Anthropic、Kimi/Moonshot、MiniMax、自托管端点(Ollama/vLLM/SGLang)等
自进化伴侣项目
使用 DSPy + GEPA 进行进化式自我改进:
- 优化技能、提示词和代码
- 与 Nous Research 的 RL 框架 Atropos 集成
- 可生成数千条工具调用轨迹,用于微调更小、更便宜的模型
最新版本亮点:v0.8.0(2026.4.8)
"The Intelligence Release"
- 🔔 后台任务自动通知
- 🆓 Nous Portal 免费提供 MiMo v2 Pro 模型
- 🔄 跨平台实时切换模型(无需重启)
- 🔒 MCP OAuth 2.1 支持
- ⏱️ 智能不活跃超时
- ✅ 审批按钮(人类监督钩子)
- 🔌 插件系统扩展(可注册 CLI 子命令、请求范围 API 钩子、会话生命周期事件)
- 📝 结构化日志(
~/.hermes/logs/)+ 启动时 YAML 配置验证 - 📦 合并 PR 209 个,修复 Issue 82 个
与竞品对比
Hermes Agent vs. OpenClaw
| 维度 | Hermes Agent | OpenClaw |
|---|---|---|
| 核心设计哲学 | 自我改进的闭合学习循环 | 控制平面优先,人工编写技能 |
| 技能来源 | 自动从任务中提取生成 | 主要由人类编写 |
| 记忆系统 | 四层分级架构 | 相对扁平 |
| 适合场景 | 长期运行、持续成长、减少重复 | 灵活工具链、宽泛响应能力 |
| 生态成熟度 | 快速增长中 | Slack/Discord 集成较成熟 |
Hermes Agent vs. AutoGPT / LangChain
- vs. AutoGPT:AutoGPT 聚焦任务分解和网络交互;Hermes 聚焦记忆、学习和技能沉淀。可互补。
- vs. LangChain:LangChain 是构建 AI 应用的工具箱;Hermes 是一个完整的 Agent 框架,内置了 LangChain 需要你自己实现的自主技能创建能力。
Hermes Agent vs. AutoResearch(Karpathy)
| 维度 | Hermes Agent | AutoResearch |
|---|---|---|
| 优化对象 | 通用任务(任何领域) | ML 训练脚本 |
| 学习方式 | 技能沉淀 + 记忆系统 | Git 版本对比 + 指标追踪 |
| 运行时间 | 永久在线 | 限时实验(5 分钟/次) |
| 人类干预 | 极少(可选审批) | 只需写 program.md |
| 核心价值 | 累积成长 | 大量快速迭代 |
对 Agent 领域的重要意义
1. "Agent 操作系统" 的雏形
v0.6.0 引入的多 Profile 支持让开发者可以从单个安装运行多个隔离的 Hermes 实例(各有独立配置、记忆、技能、会话)。这已经不是"个人助手",而是可复用的 Agent 运行时。
2. 技能即知识产权
技能可以共享(agentskills.io)、可以被社区贡献。这创造了一个 Agent 知识库的生态:好的解决方案一旦被一个 Agent 发现,就可以共享给所有人的 Agent。
3. 闭合学习循环的落地验证
Hermes 证明了自主技能创建在实际产品中是可行的 —— 不只是研究论文中的概念。
4. 指向"不断复利"的 Agent 未来
当前的 Agent 更像"工具":用完即走,不留痕迹。Hermes 的设计目标是让 Agent 变成真正的"数字同事":越用越了解你,越用越高效,形成能力复利。
局限与注意事项
⚠️ 技术门槛较高
- 需要自管基础设施
- 持久状态管理有一定复杂性
- 比 SaaS 产品的设置更繁琐
⚠️ 处于快速迭代阶段
- 版本更新频繁(每周级别)
- 可能有 Breaking Changes
- 适合愿意跟进前沿的开发者
⚠️ 单一指标的局限(与 AutoResearch 共同的问题)
自我改进依赖可量化的反馈信号,对模糊、主观的任务效果有限。
⚠️ 记忆边界
Layer 1 记忆有字符限制,长期使用需要关注记忆整合质量。
安装快速上手
我的思考空间
(留给自己的笔记区域,随时补充)
相关链接
| 资源 | 链接 |
|---|---|
| GitHub 主仓库 | NousResearch/hermes-agent |
| 官方文档 | hermes-agent.nousresearch.com/docs |
| 记忆系统文档 | Memory - Hermes Agent |
| 架构文档 | Architecture - Hermes Agent |
| 自进化伴侣项目 | hermes-agent-self-evolution |
| 精选资源列表 | awesome-hermes-agent |
Sources
- GitHub - NousResearch/hermes-agent
- Hermes Agent Documentation
- Persistent Memory - Hermes Agent
- Architecture - Hermes Agent
- Inside Hermes Agent: How a Self-Improving AI Agent Actually Works
- Hermes Agent Memory System - 3-Layer Explained
- AI 101: Hermes Agent – OpenClaw's Rival?
- Hermes Agent: A Self-Improving AI Agent That Runs Anywhere - DEV Community
- OpenClaw vs. Hermes Agent - The New Stack
- NousResearch/hermes-agent-self-evolution
Hermes Agent 项目全面解析
Hermes Agent 项目全面解析