2026-05-29 Hermes Agent Serverless:Modal/Daytona 冬眠 + Telegram 喚醒(港/日/韓/新/美)
為 AI agent 維持24/7 雲端主機,在產生任何 LLM token 費用之前,月費往往就要 NT$150–600。Hermes Agent(MIT,Nous Research)針對這一痛點,提供 無伺服器終端後端:Modal 與 Daytona 沙箱可在閒置時冬眠,僅在 Hermes 需要執行 shell 工具時喚醒——同時你在手機 Telegram 上對話。
營運成本問題
預算敏感的創業者與自動化愛好者通常面臨三類帳單:
| 費用項目 | 典型區間 | 主要驅動因素 |
|---|---|---|
| 計算 VM | NT$150–1500/月 | 網關與工具所需的常開 VPS/RDS |
| LLM API | NT$150–15000+/月 | 模型選擇 × 工具迴圈次數 |
| 出口頻寬 / 儲存 | NT$0–600/月 | 日誌、產物、Modal 磁碟 |
Hermes 無法消除 LLM 開銷——LLM 費用需另外計算。它可以在任務空檔期將閒置算力成本壓至接近零,方法是把終端執行路由到 Modal/Daytona,而不是讓一台常開大機器 24/7 跑 bash。
若你已在租用的 Mac mini M4上為 iOS 建置執行 Hermes,請參閱我們的 M4 上的 Telegram 網關 指南——本文聚焦最小化雲端運算開銷,而非最大化 Xcode 同機部署。
架構:網關 vs 終端後端
可引用技術摘要: Hermes 網關(hermes gateway)負責訊息收發;終端後端(~/.hermes/config.yaml 中的 terminal.backend)決定 bash、檔案工具與腳本在哪裡執行。
| 層級 | 閒置時是否冬眠? | 典型主機 |
|---|---|---|
| Telegram 網關(長輪詢) | 否 — 出站輪詢需要執行中的程序 | NT$150/月 VPS、家用 Mac 或租用 Mac |
| 終端後端:Modal | 是 — 工具突發間隔期間沙箱休眠 | Modal 雲 |
| 終端後端:Daytona | 是 — 工具突發間隔期間沙箱休眠 | Daytona 雲 |
| LLM 提供商 | 不適用(按 token 計費) | OpenRouter、Nous Portal 等 |
期望的喚醒路徑:
- 你在 Telegram 中向 bot 傳送訊息。
- 網關(執行在輕量主機上)接收更新。
- Hermes agent 迴圈呼叫工具 → Modal/Daytona 喚醒,執行命令並回傳輸出。
- 沙箱再次冬眠;網關可保持執行(占用少量 RAM)。
若要真正讓所有元件休眠,上游 Telegram 文件描述了 Fly.io/Railway 上的 webhook 模式(HTTPS 入站)——在僅 SSH 的 Mac 租用上較難實現。預設長輪詢更簡單,但需要常開的網關程序。
官方參考:終端後端、Telegram 設定、GitHub README。
成本決策矩陣(4 行)
| 模式 | 月閒置算力成本 | 最適合 | 權衡 |
|---|---|---|---|
| 高配 VPS 24/7 | ~NT$150–360(1 vCPU) | 心智模型最簡單 | 睡覺時也在付費 |
| 輕量 VPS 網關 + Modal/Daytona 工具 | ~NT$150 網關 + 沙箱閒置接近 NT$0 | Telegram + 突發自動化 | 需監控兩家服務商 |
| 家用 Mac / 筆電網關 | 僅電費 | 個人開發測試 | 必須保持連線 |
| 租用 Mac mini M4(MacXCode 級別) | 月租費(因地區而異) | 同一 Apple Silicon 主機跑 Xcode + agent | 非最便宜的純聊天 bot |
Modal 在沙箱執行期間按 CPU 秒和 GB 秒計費;閒置冬眠期間不產生這些費用。Daytona 宣傳類似的閒置即休眠行為——上線前請在各廠商控制台核實當前定價。免費額度需自行查證。
只有當你將網關與建置同機部署時,Apple Mac mini 規格才有意義——無伺服器終端路由並非必需。
Modal 終端後端
適用 Modal 的場景
- 突發 shell 工作(腳本、
pip install、資料拉取),Telegram 訊息間隔為數分鐘。 - 可選 GPU 規格用於 ML 任務(僅在執行期間付費)。
- 當
container_persistent: true時,透過 Modal 快照實現檔案系統持久化。
設定 ~/.hermes/config.yaml
terminal:
backend: modal
modal_image: "nikolaik/python-nodejs:python3.11-nodejs20"
container_cpu: 1
container_memory: 5120
container_disk: 51200
container_persistent: true
前置條件(上游):
pip install modal
modal token new
hermes doctor
不適合 Modal 的情況:對巨型 monorepo checkout 做亞秒級本地檔案編輯——冷啟動與映像拉取延遲會拖慢速度。請在使用已有儲存庫的機器上使用 local 或 SSH 後端。
Daytona 終端後端
Daytona 將工具執行路由到閒置時冬眠的雲端沙箱(見 Hermes 文件)。設定:
terminal:
backend: daytona
啟動網關前匯出 API 金鑰:
export DAYTONA_API_KEY="your_key"
# persist in ~/.hermes/.env for launchd
適用 Daytona 的場景:你希望獲得無伺服器持久化,又不想在 VPS 上管理 Docker——Hermes README 將 Daytona 與 Modal 並列,用於實現「工作階段間成本接近零」。
不適合 Daytona 的情況:嚴格的資料駐留要求僅限本地部署——雲端沙箱超出合規範圍。
Telegram:無需胖伺服器即可喚醒 agent
依下列方式一次性接入 Telegram(完整步驟見我們的 Telegram 網關指南):
hermes gateway setup
低成本網關主機:
- NT$150/月 VPS(1 GB RAM),僅執行
hermes gateway+~/.hermes/.env - Oracle Cloud 免費層(視地區可用性而定——請核實帳戶限額)
- 家用常開 Mac 用於實驗
在同一台機器上將 terminal.backend 指向 modal 或 daytona——網關保持輕量;重型工作由無伺服器沙箱喚醒執行。
安全:僅使用數字 TELEGRAM_ALLOWED_USERS——切勿在未設定白名單的情況下暴露 bot(透過 @userinfobot 取得你的 ID)。
在我們的 Hermes 對比 OpenClaw 與 OpenHuman 矩陣中比較 agent 框架——OpenClaw 擅長無頭 launchd 租用;Hermes 擅長學習迴圈 + Modal/Daytona 卸載。
八步手冊:近零算力棧
- 安裝 Hermes —
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash - 模型認證 —
hermes setup(自備金鑰;在 OpenRouter 選用預算型模型以控制成本)。 - 選擇無伺服器後端 — Modal(
modal token new)或 Daytona(DAYTONA_API_KEY)。 - 撰寫
~/.hermes/config.yaml— 依上文資源限制設定terminal.backend: modal或daytona。 - Telegram —
hermes gateway setup;確認~/.hermes/.env。 - 輕量網關主機 — 在 VPS 上部署
hermes gateway install && hermes gateway start(不要放在昂貴的 GPU 機器上)。 - 冒煙測試 — 向 bot 傳訊息:「執行
uname -a並回報」——在 Modal/Daytona 控制台觀察沙箱啟停。 - 成本護欄 — 設定服務商消費上限;假期若不需要網關,可排程執行
hermes gateway stop。
故障排除
機器人能回覆「hello」但工具因 Modal 鑑權失敗
| 症狀 | 修復 |
|---|---|
modal token 缺失 | 在網關主機使用者下執行 modal token new |
| Python 環境錯誤 | hermes doctor;在 Hermes venv 中安裝 modal |
| 沙箱過期 | 切換 container_persistent 或清除 Modal 應用日誌 |
沙箱在執行但 Telegram 無回覆
- 網關未執行:
hermes gateway status - 檢查
~/.hermes/logs/gateway.log中的 Telegram 權杖錯誤 - 同一 bot token 只能有一個程序輪詢(
Conflict: terminated by other getUpdates)
費用高於預期
- LLM token 占大頭——切換模型、縮短工具迴圈,或依上游 CLI 文件在聊天中使用
/compress - Modal 持久磁碟快照仍會產生存儲費——縮減
container_disk - 網關 VPS 仍停在 4 GB RAM 方案——若僅做輪詢可降至 1 GB
MEDIA: 從 Modal 後端傳送檔案附件失敗
網關從主機路徑傳送檔案——在 Modal 內部,請寫入上游文件 Telegram + Docker 章節中記錄的主機掛載卷路徑。
FAQ
hermes doctor。