AI / Automation

2026-05-29 Hermes Agent ServerlessModal/Daytona 冬眠 + Telegram 唤醒港/日/韩/新/美

为 AI agent 维持24/7 云主机,在产生任何 LLM token 费用之前,月费往往就要 ¥35–140Hermes Agent(MIT,Nous Research)针对这一痛点,提供 无服务器终端后端ModalDaytona 沙箱可在空闲时冬眠,仅在 Hermes 需要执行 shell 工具时唤醒——同时你在手机 Telegram 上对话。

重要说明(避免预算失控):上游明确区分网关监听位置(通常为运行 Telegram 长轮询的小型常开主机)与重型命令执行位置(Modal/Daytona)。本文展示的是最低成本的诚实架构,而非「包括模型 API 在内全部 ¥0」。
披露:MacXCode 为需要常开 Xcode CI 或 OpenClaw 网关的团队提供 Apple Silicon Mac mini M4 租用——我们仅在成本矩阵中作为对比提及租用,并非最便宜的 Telegram+Hermes 路径。
Hermes Agent 无服务器 Modal Daytona Telegram 冬眠 云端 Mac mini M4

运营成本问题

预算敏感的创业者与自动化爱好者通常面临三类账单:

费用项典型区间主要驱动因素
计算 VM¥35–350/月网关与工具所需的常开 VPS/RDS
LLM API¥35–3500+/月模型选择 × 工具循环次数
出口带宽 / 存储¥0–140/月日志、产物、Modal 磁盘

Hermes 无法消除 LLM 开销——LLM 费用需单独计算。它可以在任务空档期将空闲算力成本压至接近零,方法是把终端执行路由到 Modal/Daytona,而不是让一台常开大机器 24/7 跑 bash

若你已在租用的 Mac mini M4上为 iOS 构建运行 Hermes,请参阅我们的 M4 上的 Telegram 网关 指南——本文聚焦最小化云计算开销,而非最大化 Xcode 同机部署。

架构:网关 vs 终端后端

可引用技术摘要: Hermes 网关hermes gateway)负责消息收发;终端后端~/.hermes/config.yaml 中的 terminal.backend)决定 bash、文件工具与脚本在哪里执行。

层级空闲时是否冬眠?典型主机
Telegram 网关(长轮询) — 出站轮询需要运行中的进程¥35/月 VPS、家用 Mac 或租用 Mac
终端后端:Modal — 工具突发间隔期间沙箱休眠Modal
终端后端:Daytona — 工具突发间隔期间沙箱休眠Daytona 云
LLM 提供商不适用(按 token 计费)OpenRouter、Nous Portal 等

期望的唤醒路径:

  1. 你在 Telegram 中向 bot 发送消息。
  2. 网关(运行在轻量主机上)接收更新。
  3. Hermes agent 循环调用工具 → Modal/Daytona 唤醒,执行命令并返回输出。
  4. 沙箱再次冬眠;网关可保持运行(占用少量 RAM)。

若要真正让所有组件休眠,上游 Telegram 文档描述了 Fly.io/Railway 上的 webhook 模式(HTTPS 入站)——在仅 SSH 的 Mac 租用上较难实现。默认长轮询更简单,但需要常开的网关进程

官方参考:终端后端Telegram 配置GitHub README

成本决策矩阵(4 行)

模式月空闲算力成本最适合权衡
高配 VPS 24/7~¥35–85(1 vCPU)心智模型最简单睡觉时也在付费
轻量 VPS 网关 + Modal/Daytona 工具~¥35–50 网关 + 沙箱空闲接近 ¥0Telegram + 突发自动化需监控两家服务商
家用 Mac / 笔记本网关仅电费个人开发测试必须保持在线
租用 Mac mini M4(MacXCode 级别)月租费(因地区而异)同一 Apple Silicon 主机跑 Xcode + agent非最便宜的纯聊天 bot

Modal 在沙箱运行期间按 CPU 秒和 GB 秒计费;空闲冬眠期间不产生这些费用。Daytona 宣传类似的空闲即休眠行为——投产前请在各厂商控制台核实当前定价。

只有当你将网关与构建同机部署时,Apple Mac mini 规格才有意义——无服务器终端路由并非必需。

适用 Modal 的场景

  • 突发 shell 工作(脚本、pip install、数据拉取),Telegram 消息间隔为数分钟
  • 可选 GPU 规格用于 ML 任务(仅在运行期间付费)。
  • container_persistent: true 时,通过 Modal 快照实现文件系统持久化。

配置 ~/.hermes/config.yaml

terminal: backend: modal modal_image: "nikolaik/python-nodejs:python3.11-nodejs20" container_cpu: 1 container_memory: 5120 container_disk: 51200 container_persistent: true

前置条件(上游):

pip install modal modal token new hermes doctor

不适合 Modal 的情况:对巨型 monorepo checkout 做亚秒级本地文件编辑——冷启动与镜像拉取延迟会拖慢速度。请在使用已有仓库的机器上使用 localSSH 后端。

Daytona 终端后端

Daytona 将工具执行路由到空闲时冬眠云端沙箱(见 Hermes 文档)。设置:

terminal: backend: daytona

启动网关前导出 API 密钥:

export DAYTONA_API_KEY="your_key" # persist in ~/.hermes/.env for launchd

适用 Daytona 的场景:你希望获得无服务器持久化,又不想在 VPS 上管理 Docker——Hermes README 将 Daytona 与 Modal 并列,用于实现「会话间成本接近为零」。

不适合 Daytona 的情况:严格的数据驻留要求仅限本地部署——云端沙箱超出合规范围。

Telegram:无需胖服务器即可唤醒 agent

按下列方式一次性接入 Telegram(完整步骤见我们的 Telegram 网关指南):

hermes gateway setup

低成本网关主机:

  • ¥35/月 VPS(1 GB RAM),仅运行 hermes gateway + ~/.hermes/.env
  • Oracle Cloud 免费层(视地区可用性而定——请核实账户限额)
  • 家用常开 Mac 用于实验

在同一台机器上将 terminal.backend 指向 modaldaytona——网关保持轻量;重型工作由无服务器沙箱唤醒执行

安全:仅使用数字 TELEGRAM_ALLOWED_USERS——切勿在未配置白名单的情况下暴露 bot(通过 @userinfobot 获取你的 ID)。

在我们的 Hermes 对比 OpenClaw 与 OpenHuman 矩阵中比较 agent 框架——OpenClaw 擅长无头 launchd 租用;Hermes 擅长学习循环 + Modal/Daytona 卸载。

八步手册:近零算力栈

  1. 安装 Hermescurl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
  2. 模型认证hermes setup(自带密钥;在 OpenRouter 选用预算型模型以控制成本)。
  3. 选择无服务器后端 — Modal(modal token new Daytona(DAYTONA_API_KEY)。
  4. 编写 ~/.hermes/config.yaml — 按上文资源限制设置 terminal.backend: modaldaytona
  5. Telegramhermes gateway setup;确认 ~/.hermes/.env
  6. 轻量网关主机 — 在 VPS 上部署 hermes gateway install && hermes gateway start(不要放在昂贵的 GPU 机器上)。
  7. 冒烟测试 — 向 bot 发消息:「运行 uname -a 并报告」——在 Modal/Daytona 控制台观察沙箱启停。
  8. 成本护栏 — 设置服务商消费上限;假期若不需要网关,可计划执行 hermes gateway stop

故障排查

机器人能回复「hello」但工具因 Modal 鉴权失败

症状修复
modal token 缺失网关主机用户下运行 modal token new
Python 环境错误hermes doctor;在 Hermes venv 中安装 modal
沙箱过期切换 container_persistent 或清除 Modal 应用日志

沙箱在运行但 Telegram 无回复

  • 网关未运行:hermes gateway status
  • 检查 ~/.hermes/logs/gateway.log 中的 Telegram 令牌错误
  • 同一 bot token 只能有一个进程轮询(Conflict: terminated by other getUpdates

费用高于预期

  • LLM token 占大头——切换模型、缩短工具循环,或按上游 CLI 文档在聊天中使用 /compress
  • Modal 持久磁盘快照仍会产生存储费——缩减 container_disk
  • 网关 VPS 仍停在 4 GB RAM 档位——若仅做轮询可降至 1 GB

MEDIA: 从 Modal 后端发送文件附件失败

网关从主机路径发送文件——在 Modal 内部,请写入上游文档 Telegram + Docker 章节中记录的主机挂载卷路径。

FAQ

月开销能真的是 ¥0 吗?+
端到端不太可能。空闲时 Modal/Daytona 算力可接近 ¥0,但网关层(约 ¥35–50/月)、TelegramLLM API(需单独计算)通常仍有费用。免费额度会变——请每月核对厂商页面。
Telegram 空闲时整个 Hermes 都会冬眠吗?+
终端沙箱会。默认长轮询的网关保持唤醒,除非改用 webhook 托管或停止服务。
选 Modal 还是 Daytona?+
要 GPU/CPU 规格与快照持久化,倾向 Modal;偏好其沙箱体验可选 Daytona——配置后运行 hermes doctor
能替代租用 Mac mini M4 吗?+
Xcode CI不能。做无需 Apple Silicon 与 24/7 磁盘的 个人 Telegram 自动化可以
官方 serverless 文档在哪?+
Hermes 终端后端NousResearch/hermes-agent README(六种后端:local、Docker、SSH、Singularity、Modal、Daytona)。

预算型自动化,无需胖 VM

若只需 Telegram + 突发工具,轻量网关 + Modal/Daytona 冬眠通常比 24/7 shell 主机更省—仅当需要 Xcode 同机时才考虑租用 M4。