不懂命令行也能装好的 AI Agent，手把手教

本文最后更新于 2026-04-17，文章内容可能已经过时。

本文适合完全没有命令行经验的新手，也适合从 OpenClaw 迁移过来的用户。手把手带你从零开始，装好 Hermes Agent，接入 Telegram，并了解它的核心玩法。

Nous Research 二月底放出来，不到两个月 GitHub 涨到 35K star。它叫 Hermes Agent，但它干的事，和你平时用的那些 AI 聊天工具不太一样。

大多数人用 AI，是开网页问两句，聊完关掉。Hermes 不是这个用法。它跑在服务器上，你不在的时候它还在干活。你睡了，它还在处理任务。把 AI 当基础设施跑，而不是当聊天窗口开——理解这个，才算知道它能拿来干什么。

有一点值得单独说：它会自己积累经验。 完成一个复杂任务后，Hermes 把执行过程整理成文档存下来，下次遇到类似任务直接调，不用重新描述一遍。调用次数到一定量，会自动调优。有用户反馈两小时内自动生成了三份技能，重复任务快了 40%。

国内用户怎么选模型

这是第一个容易卡住的地方，先说清楚。

推荐优先用这两个：硅基流动（SiliconFlow） 和 DeepSeek API。注册即用，国内访问稳定，不需要代理，价格也便宜。

想零成本的话，本地跑 Ollama + Gemma4，有用户在 MacBook Pro 上跑过，没问题，模型费用直接归零。有条件访问境外服务的，OpenRouter 上有免费模型可选。

⚠️ 关于 Claude：Anthropic 4 月 7 日起调整政策，第三方工具不再走订阅额度，改按量计费。国内访问本身也不稳定，不建议当主力模型。

开始之前，确认两件事

第一，确认 Git 已安装。 打开终端，输入：

git version

能看到版本号就行。报错的话，Ubuntu/Debian 执行 sudo apt install git，macOS 执行 brew install git。

第二，备好 API Key。 硅基流动和 DeepSeek 都兼容 OpenAI 格式，直接填就行。

💡 Windows 用户：需要先装 WSL2，再在里面操作。微软官方文档搜「安装 WSL」，按步骤来，装完回这里继续。

第一步：安装

⚠️ 安装脚本要访问 GitHub，国内直连不稳定。建议终端配好代理后再跑，或直接用香港 VPS 操作。梯子不稳容易卡住，换个稳定节点再试。

终端执行这一行：

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

脚本会自动检测环境、安装依赖、克隆仓库、注册全局 hermes 命令。要装的东西比较多，耐心等完，别中途关终端。

装完会进引导设置，选 Quick setup：

国内用户选「兼容 OpenAI 格式」，填硅基流动或 DeepSeek 的 base URL 和 API Key
想免费跑的话选本地 Ollama，模型选 Gemma4
最后问要不要注册成系统服务，选 Y 就能开机自启、后台常驻

设置完，终端输入：

hermes

看到对话界面，就装好了。

⚠️ 提示找不到 hermes 命令？执行 source ~/.bashrc 或 source ~/.zshrc，或者重开一个终端窗口。

第二步：接入聊天平台（可选）

只用命令行的话这步跳过。

国内用户优先推荐飞书 / 企业微信 / 钉钉，网络稳定，在引导菜单里选对应平台配置就行，请参考官方消息平台接入指南。

下面以 Telegram 为例（需要代理）：

打开 Telegram，搜索 BotFather（官方账号，有蓝色认证标），发送 /newbot，依次填显示名称和用户名（用户名必须以 bot 结尾）。创建成功后会收到一串 HTTP API Token，复制保存好。

然后终端执行：

hermes gateway setup

选 Telegram，把 Token 粘进去。粘贴时终端没有任何显示，这是正常的，直接回车。

接着填你的 Telegram 数字 ID（Allowed User ID）。不知道自己 ID 的话，给 @userinfobot 发条消息，它会直接回复。不填这个的话任何人都能用你的 Bot，务必填上。

配置完终端会给一条命令，复制执行，然后去 Telegram 找到你的 Bot 发条消息，收到回复就成了。

第三步：验证

hermes doctor

全绿就没问题。有报错它会告诉你具体哪里出了问题。

用起来真正有感知的几个地方

Skills 自动积累。 完成复杂任务后，Hermes 把执行过程整理成 Markdown 文档存下来，下次类似任务直接调用，记录调用次数，到量自动调优。用得越多越顺手，不是说说而已。

记忆分两层，成本更稳定。 核心信息写在 MEMORY.md 里，每次对话都带着；历史对话全量存 SQLite，按需检索，没有容量上限。OpenClaw 每次任务都把历史上下文塞进 prompt，记得越多烧得越多。Hermes 按需召回，成本基本不随时间涨——这是它比 OpenClaw 便宜 30%–60% 的根本原因。

执行过程透明。 IM 里能看到每一步 tool_call 的执行过程，知道 Agent 在干什么，不是黑盒。

人格定制。 在 ~/.hermes/SOUL.md 里写几行，就能定义 Agent 的说话风格和处事偏好。想要务实的工程师助手还是幽默的助理，自己定。

语音交互。 CLI 里按 Ctrl+B 录音，支持本地 Whisper（免费）或 Groq 做识别。平时用不到，有需要时是个加分项。

不想用命令行？

Hermes WebUI 是专门为 Hermes 做的网页界面，直接和 Agent 聊，对新手友好。需要代理访问：github.com/nesquena/hermes-webui

接入现有工具： Hermes 内置兼容 OpenAI API 格式的服务端，Open WebUI、Cherry Studio 等支持自定义 API endpoint 的工具可以直接接，不用重新熟悉界面。Cherry Studio 国内可以直接下载，推荐。

费用大概多少

可以跑在 5 美元/月的 VPS 上。国内用腾讯云或阿里云轻量服务器，入门配置够用，香港节点最省事。

同等使用强度下比 OpenClaw 便宜 30%–60%，原因前面说了：架构不同，成本不随历史积累膨胀。接国内模型（硅基流动 / DeepSeek）还能再低一截，本地跑 Ollama + Gemma4 的话，模型费用归零。

⚠️ 社区高频翻车案例：忘了关 Sonnet 跑了一夜。OpenClaw 用户第二天看账单哭了，Hermes 用户因为架构不同，翻车金额小一个数量级。换国内模型的话，翻车风险更小。

安全性

七层防御：用户授权白名单、危险命令人工审批、Docker 容器隔离、凭证过滤、内容注入扫描、URL 验证、预执行终端攻击检测。高风险操作默认需要人工确认，超时自动拒绝。

接入 Telegram 后，账号安全直接等于 Agent 安全，建议开启两步验证。

💡 技能文件存在本地，随时可以打开查看和删除。hermes doctor 可以定期检查运行状态。

常见问题

国内能直接安装吗？ 安装脚本需要访问 GitHub，建议终端配好代理再跑，或直接用香港 VPS 操作。

不想用 OpenRouter，有国内替代吗？ 硅基流动（siliconflow.cn）和 DeepSeek（platform.deepseek.com）都支持 OpenAI 兼容格式，注册即用。想完全免费的话，本地跑 Ollama + Gemma4。

Claude 订阅还能用吗？ 4 月 7 日起不行了，建议直接换硅基流动或 DeepSeek。

装完输入 hermes 提示 command not found？ PATH 没刷新。关掉终端重开一个，或者执行 source ~/.bashrc / source ~/.zshrc。

粘贴 Bot Token 没有显示，出错了吗？ 没出错，终端输入密钥时不回显，这是安全机制，直接回车就行。

从 OpenClaw 迁移过来，原来的配置能用吗？ 能用，执行 hermes claw migrate，会自动导入原有的技能、记忆和设置。

/llm_wiki 是什么？ 新版本加的功能，在 IM 里直接发 /llm_wiki 就能查大模型相关知识，比手动搜省事。

官方文档：hermes-agent.nousresearch.com/docs

GitHub：github.com/NousResearch/hermes-agent