2026-05-29 Hermes Agent Serverless:Modal/Daytona 冬眠 + Telegram 唤醒(港/日/韩/新/美)
为 AI agent 维持24/7 云主机,在产生任何 LLM token 费用之前,月费往往就要 ¥35–140。Hermes Agent(MIT,Nous Research)针对这一痛点,提供 无服务器终端后端:Modal 与 Daytona 沙箱可在空闲时冬眠,仅在 Hermes 需要执行 shell 工具时唤醒——同时你在手机 Telegram 上对话。
运营成本问题
预算敏感的创业者与自动化爱好者通常面临三类账单:
| 费用项 | 典型区间 | 主要驱动因素 |
|---|---|---|
| 计算 VM | ¥35–350/月 | 网关与工具所需的常开 VPS/RDS |
| LLM API | ¥35–3500+/月 | 模型选择 × 工具循环次数 |
| 出口带宽 / 存储 | ¥0–140/月 | 日志、产物、Modal 磁盘 |
Hermes 无法消除 LLM 开销——LLM 费用需单独计算。它可以在任务空档期将空闲算力成本压至接近零,方法是把终端执行路由到 Modal/Daytona,而不是让一台常开大机器 24/7 跑 bash。
若你已在租用的 Mac mini M4上为 iOS 构建运行 Hermes,请参阅我们的 M4 上的 Telegram 网关 指南——本文聚焦最小化云计算开销,而非最大化 Xcode 同机部署。
架构:网关 vs 终端后端
可引用技术摘要: Hermes 网关(hermes gateway)负责消息收发;终端后端(~/.hermes/config.yaml 中的 terminal.backend)决定 bash、文件工具与脚本在哪里执行。
| 层级 | 空闲时是否冬眠? | 典型主机 |
|---|---|---|
| Telegram 网关(长轮询) | 否 — 出站轮询需要运行中的进程 | ¥35/月 VPS、家用 Mac 或租用 Mac |
| 终端后端:Modal | 是 — 工具突发间隔期间沙箱休眠 | Modal 云 |
| 终端后端:Daytona | 是 — 工具突发间隔期间沙箱休眠 | Daytona 云 |
| LLM 提供商 | 不适用(按 token 计费) | OpenRouter、Nous Portal 等 |
期望的唤醒路径:
- 你在 Telegram 中向 bot 发送消息。
- 网关(运行在轻量主机上)接收更新。
- Hermes agent 循环调用工具 → Modal/Daytona 唤醒,执行命令并返回输出。
- 沙箱再次冬眠;网关可保持运行(占用少量 RAM)。
若要真正让所有组件休眠,上游 Telegram 文档描述了 Fly.io/Railway 上的 webhook 模式(HTTPS 入站)——在仅 SSH 的 Mac 租用上较难实现。默认长轮询更简单,但需要常开的网关进程。
官方参考:终端后端、Telegram 配置、GitHub README。
成本决策矩阵(4 行)
| 模式 | 月空闲算力成本 | 最适合 | 权衡 |
|---|---|---|---|
| 高配 VPS 24/7 | ~¥35–85(1 vCPU) | 心智模型最简单 | 睡觉时也在付费 |
| 轻量 VPS 网关 + Modal/Daytona 工具 | ~¥35–50 网关 + 沙箱空闲接近 ¥0 | Telegram + 突发自动化 | 需监控两家服务商 |
| 家用 Mac / 笔记本网关 | 仅电费 | 个人开发测试 | 必须保持在线 |
| 租用 Mac mini M4(MacXCode 级别) | 月租费(因地区而异) | 同一 Apple Silicon 主机跑 Xcode + agent | 非最便宜的纯聊天 bot |
Modal 在沙箱运行期间按 CPU 秒和 GB 秒计费;空闲冬眠期间不产生这些费用。Daytona 宣传类似的空闲即休眠行为——投产前请在各厂商控制台核实当前定价。
只有当你将网关与构建同机部署时,Apple Mac mini 规格才有意义——无服务器终端路由并非必需。
Modal 终端后端
适用 Modal 的场景
- 突发 shell 工作(脚本、
pip install、数据拉取),Telegram 消息间隔为数分钟。 - 可选 GPU 规格用于 ML 任务(仅在运行期间付费)。
- 当
container_persistent: true时,通过 Modal 快照实现文件系统持久化。
配置 ~/.hermes/config.yaml
terminal:
backend: modal
modal_image: "nikolaik/python-nodejs:python3.11-nodejs20"
container_cpu: 1
container_memory: 5120
container_disk: 51200
container_persistent: true
前置条件(上游):
pip install modal
modal token new
hermes doctor
不适合 Modal 的情况:对巨型 monorepo checkout 做亚秒级本地文件编辑——冷启动与镜像拉取延迟会拖慢速度。请在使用已有仓库的机器上使用 local 或 SSH 后端。
Daytona 终端后端
Daytona 将工具执行路由到空闲时冬眠的云端沙箱(见 Hermes 文档)。设置:
terminal:
backend: daytona
启动网关前导出 API 密钥:
export DAYTONA_API_KEY="your_key"
# persist in ~/.hermes/.env for launchd
适用 Daytona 的场景:你希望获得无服务器持久化,又不想在 VPS 上管理 Docker——Hermes README 将 Daytona 与 Modal 并列,用于实现「会话间成本接近为零」。
不适合 Daytona 的情况:严格的数据驻留要求仅限本地部署——云端沙箱超出合规范围。
Telegram:无需胖服务器即可唤醒 agent
按下列方式一次性接入 Telegram(完整步骤见我们的 Telegram 网关指南):
hermes gateway setup
低成本网关主机:
- ¥35/月 VPS(1 GB RAM),仅运行
hermes gateway+~/.hermes/.env - Oracle Cloud 免费层(视地区可用性而定——请核实账户限额)
- 家用常开 Mac 用于实验
在同一台机器上将 terminal.backend 指向 modal 或 daytona——网关保持轻量;重型工作由无服务器沙箱唤醒执行。
安全:仅使用数字 TELEGRAM_ALLOWED_USERS——切勿在未配置白名单的情况下暴露 bot(通过 @userinfobot 获取你的 ID)。
在我们的 Hermes 对比 OpenClaw 与 OpenHuman 矩阵中比较 agent 框架——OpenClaw 擅长无头 launchd 租用;Hermes 擅长学习循环 + Modal/Daytona 卸载。
八步手册:近零算力栈
- 安装 Hermes —
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash - 模型认证 —
hermes setup(自带密钥;在 OpenRouter 选用预算型模型以控制成本)。 - 选择无服务器后端 — Modal(
modal token new)或 Daytona(DAYTONA_API_KEY)。 - 编写
~/.hermes/config.yaml— 按上文资源限制设置terminal.backend: modal或daytona。 - Telegram —
hermes gateway setup;确认~/.hermes/.env。 - 轻量网关主机 — 在 VPS 上部署
hermes gateway install && hermes gateway start(不要放在昂贵的 GPU 机器上)。 - 冒烟测试 — 向 bot 发消息:「运行
uname -a并报告」——在 Modal/Daytona 控制台观察沙箱启停。 - 成本护栏 — 设置服务商消费上限;假期若不需要网关,可计划执行
hermes gateway stop。
故障排查
机器人能回复「hello」但工具因 Modal 鉴权失败
| 症状 | 修复 |
|---|---|
modal token 缺失 | 在网关主机用户下运行 modal token new |
| Python 环境错误 | hermes doctor;在 Hermes venv 中安装 modal |
| 沙箱过期 | 切换 container_persistent 或清除 Modal 应用日志 |
沙箱在运行但 Telegram 无回复
- 网关未运行:
hermes gateway status - 检查
~/.hermes/logs/gateway.log中的 Telegram 令牌错误 - 同一 bot token 只能有一个进程轮询(
Conflict: terminated by other getUpdates)
费用高于预期
- LLM token 占大头——切换模型、缩短工具循环,或按上游 CLI 文档在聊天中使用
/compress - Modal 持久磁盘快照仍会产生存储费——缩减
container_disk - 网关 VPS 仍停在 4 GB RAM 档位——若仅做轮询可降至 1 GB
MEDIA: 从 Modal 后端发送文件附件失败
网关从主机路径发送文件——在 Modal 内部,请写入上游文档 Telegram + Docker 章节中记录的主机挂载卷路径。
FAQ
hermes doctor。