不懂命令行也能装好的 AI Agent,手把手教
本文适合完全没有命令行经验的新手,也适合从 OpenClaw 迁移过来的用户。手把手带你从零开始,装好 Hermes Agent,接入 Telegram,并了解它的核心玩法。
Nous Research 二月底放出来,不到两个月 GitHub 涨到 35K star。它叫 Hermes Agent,但它干的事,和你平时用的那些 AI 聊天工具不太一样。
大多数人用 AI,是开网页问两句,聊完关掉。Hermes 不是这个用法。它跑在服务器上,你不在的时候它还在干活。你睡了,它还在处理任务。把 AI 当基础设施跑,而不是当聊天窗口开——理解这个,才算知道它能拿来干什么。
有一点值得单独说:它会自己积累经验。 完成一个复杂任务后,Hermes 把执行过程整理成文档存下来,下次遇到类似任务直接调,不用重新描述一遍。调用次数到一定量,会自动调优。有用户反馈两小时内自动生成了三份技能,重复任务快了 40%。
国内用户怎么选模型
这是第一个容易卡住的地方,先说清楚。
推荐优先用这两个:硅基流动(SiliconFlow) 和 DeepSeek API。注册即用,国内访问稳定,不需要代理,价格也便宜。
想零成本的话,本地跑 Ollama + Gemma4,有用户在 MacBook Pro 上跑过,没问题,模型费用直接归零。有条件访问境外服务的,OpenRouter 上有免费模型可选。
⚠️ 关于 Claude:Anthropic 4 月 7 日起调整政策,第三方工具不再走订阅额度,改按量计费。国内访问本身也不稳定,不建议当主力模型。
开始之前,确认两件事
第一,确认 Git 已安装。 打开终端,输入:
git version能看到版本号就行。报错的话,Ubuntu/Debian 执行 sudo apt install git,macOS 执行 brew install git。
第二,备好 API Key。 硅基流动和 DeepSeek 都兼容 OpenAI 格式,直接填就行。
💡 Windows 用户:需要先装 WSL2,再在里面操作。微软官方文档搜「安装 WSL」,按步骤来,装完回这里继续。
第一步:安装
⚠️ 安装脚本要访问 GitHub,国内直连不稳定。建议终端配好代理后再跑,或直接用香港 VPS 操作。梯子不稳容易卡住,换个稳定节点再试。
终端执行这一行:
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash脚本会自动检测环境、安装依赖、克隆仓库、注册全局 hermes 命令。要装的东西比较多,耐心等完,别中途关终端。
装完会进引导设置,选 Quick setup:
国内用户选「兼容 OpenAI 格式」,填硅基流动或 DeepSeek 的 base URL 和 API Key
想免费跑的话选本地 Ollama,模型选 Gemma4
最后问要不要注册成系统服务,选 Y 就能开机自启、后台常驻
设置完,终端输入:
hermes看到对话界面,就装好了。
⚠️ 提示找不到
hermes命令?执行source ~/.bashrc或source ~/.zshrc,或者重开一个终端窗口。
第二步:接入聊天平台(可选)
只用命令行的话这步跳过。
国内用户优先推荐飞书 / 企业微信 / 钉钉,网络稳定,在引导菜单里选对应平台配置就行,请参考官方消息平台接入指南。
下面以 Telegram 为例(需要代理):
打开 Telegram,搜索 BotFather(官方账号,有蓝色认证标),发送 /newbot,依次填显示名称和用户名(用户名必须以 bot 结尾)。创建成功后会收到一串 HTTP API Token,复制保存好。
然后终端执行:
hermes gateway setup选 Telegram,把 Token 粘进去。粘贴时终端没有任何显示,这是正常的,直接回车。
接着填你的 Telegram 数字 ID(Allowed User ID)。不知道自己 ID 的话,给 @userinfobot 发条消息,它会直接回复。不填这个的话任何人都能用你的 Bot,务必填上。
配置完终端会给一条命令,复制执行,然后去 Telegram 找到你的 Bot 发条消息,收到回复就成了。
第三步:验证
hermes doctor全绿就没问题。有报错它会告诉你具体哪里出了问题。
用起来真正有感知的几个地方
Skills 自动积累。 完成复杂任务后,Hermes 把执行过程整理成 Markdown 文档存下来,下次类似任务直接调用,记录调用次数,到量自动调优。用得越多越顺手,不是说说而已。
记忆分两层,成本更稳定。 核心信息写在 MEMORY.md 里,每次对话都带着;历史对话全量存 SQLite,按需检索,没有容量上限。OpenClaw 每次任务都把历史上下文塞进 prompt,记得越多烧得越多。Hermes 按需召回,成本基本不随时间涨——这是它比 OpenClaw 便宜 30%–60% 的根本原因。
执行过程透明。 IM 里能看到每一步 tool_call 的执行过程,知道 Agent 在干什么,不是黑盒。
人格定制。 在 ~/.hermes/SOUL.md 里写几行,就能定义 Agent 的说话风格和处事偏好。想要务实的工程师助手还是幽默的助理,自己定。
语音交互。 CLI 里按 Ctrl+B 录音,支持本地 Whisper(免费)或 Groq 做识别。平时用不到,有需要时是个加分项。
不想用命令行?
Hermes WebUI 是专门为 Hermes 做的网页界面,直接和 Agent 聊,对新手友好。需要代理访问:github.com/nesquena/hermes-webui
接入现有工具: Hermes 内置兼容 OpenAI API 格式的服务端,Open WebUI、Cherry Studio 等支持自定义 API endpoint 的工具可以直接接,不用重新熟悉界面。Cherry Studio 国内可以直接下载,推荐。
费用大概多少
可以跑在 5 美元/月的 VPS 上。国内用腾讯云或阿里云轻量服务器,入门配置够用,香港节点最省事。
同等使用强度下比 OpenClaw 便宜 30%–60%,原因前面说了:架构不同,成本不随历史积累膨胀。接国内模型(硅基流动 / DeepSeek)还能再低一截,本地跑 Ollama + Gemma4 的话,模型费用归零。
⚠️ 社区高频翻车案例:忘了关 Sonnet 跑了一夜。OpenClaw 用户第二天看账单哭了,Hermes 用户因为架构不同,翻车金额小一个数量级。换国内模型的话,翻车风险更小。
安全性
七层防御:用户授权白名单、危险命令人工审批、Docker 容器隔离、凭证过滤、内容注入扫描、URL 验证、预执行终端攻击检测。高风险操作默认需要人工确认,超时自动拒绝。
接入 Telegram 后,账号安全直接等于 Agent 安全,建议开启两步验证。
💡 技能文件存在本地,随时可以打开查看和删除。
hermes doctor可以定期检查运行状态。
常见问题
国内能直接安装吗? 安装脚本需要访问 GitHub,建议终端配好代理再跑,或直接用香港 VPS 操作。
不想用 OpenRouter,有国内替代吗? 硅基流动(siliconflow.cn)和 DeepSeek(platform.deepseek.com)都支持 OpenAI 兼容格式,注册即用。想完全免费的话,本地跑 Ollama + Gemma4。
Claude 订阅还能用吗? 4 月 7 日起不行了,建议直接换硅基流动或 DeepSeek。
装完输入 hermes 提示 command not found? PATH 没刷新。关掉终端重开一个,或者执行 source ~/.bashrc / source ~/.zshrc。
粘贴 Bot Token 没有显示,出错了吗? 没出错,终端输入密钥时不回显,这是安全机制,直接回车就行。
从 OpenClaw 迁移过来,原来的配置能用吗? 能用,执行 hermes claw migrate,会自动导入原有的技能、记忆和设置。
/llm_wiki 是什么? 新版本加的功能,在 IM 里直接发 /llm_wiki 就能查大模型相关知识,比手动搜省事。