2026-05-29 Hermes Agent Serverless:Modal/Daytona 冬眠 + Telegram 起動(HK / JP / KR / SG / US・東京ノード)
AI agent 用の24/7 クラウド VMは、LLM token を 1 つも使う前に月額 ¥750–3,000かかることがあります。Hermes Agent(MIT、Nous Research)は、この課題にサーバーレス端末バックエンドで応えます:Modal と Daytona サンドボックスはアイドル時に冬眠し、Hermes が shell ツールを実行するときだけ起動します—スマホの Telegram から会話しながら。
運用コストの問題
予算を意識する創業者や automation 愛好家は、次の 3 つの請求に直面します:
| 費用項目 | 典型的な範囲 | 主な要因 |
|---|---|---|
| Compute VM | 月額 ¥750–7,500 | ゲートウェイとツール用の常時起動 VPS/RDS |
| LLM API | 月額 ¥750–75,000+ | モデル選択 × ツールループ回数 |
| 出口帯域 / ストレージ | 月額 ¥0–3,000 | ログ、成果物、Modal ディスク |
Hermes は LLM 費用を削減しません—LLM は別途計算してください。タスクの空き時間にアイドル算力コストをほぼゼロに抑えられます。方法は端末実行を Modal/Daytona にルーティングし、常時起動マシンで 24/7 bash を回さないことです。
iOS ビルド用にレンタル Mac mini M4で Hermes を既に運用している場合は、M4 上の Telegram ゲートウェイガイドを参照してください—本稿は Xcode 同居の最大化ではなくクラウド compute の最小化が目的です。
アーキテクチャ:ゲートウェイ vs 端末バックエンド
引用可能な技術要約: Hermes ゲートウェイ(hermes gateway)がメッセージングを担当;端末バックエンド(~/.hermes/config.yaml の terminal.backend)が bash、ファイルツール、スクリプトの実行場所を決定します。
| レイヤー | アイドル時に冬眠? | typical ホスト |
|---|---|---|
| Telegram ゲートウェイ(long polling) | いいえ — outbound poll には実行中プロセスが必要 | 月額 ¥750 VPS、自宅 Mac、レンタル Mac |
| 端末バックエンド:Modal | はい — ツール burst 間隔でサンドボックス休眠 | Modal クラウド |
| 端末バックエンド:Daytona | はい — ツール burst 間隔でサンドボックス休眠 | Daytona クラウド |
| LLM プロバイダー | 該当なし(token 課金) | OpenRouter、Nous Portal 等 |
望ましい起動パス:
- Telegram で bot にメッセージを送ります。
- ゲートウェイ(軽量ホスト上)が更新を受信します。
- Hermes agent ループがツールを呼び出す → Modal/Daytona が起動、コマンド実行、出力を返します。
- サンドボックスが再び冬眠;ゲートウェイは起動したまま(少量 RAM)の場合があります。
本当にすべてをスリープさせるには、上流 Telegram ドキュメントが Fly.io/Railway 上の webhook モード(HTTPS ingress)を説明しています—SSH のみの Mac レンタルでは難しいです。デフォルトの long polling は簡単ですが、常時起動ゲートウェイプロセスが必要です。
公式参照:端末バックエンド、Telegram 設定、GitHub README。
コスト判断マトリクス(4 行)
| パターン | 月額アイドル算力 | 最適用途 | トレードオフ |
|---|---|---|---|
| 太い VPS 24/7 | ~月額 ¥750–1,800(1 vCPU) | 最も単純な mental model | 睡眠中も課金 |
| 軽量 VPS ゲートウェイ + Modal/Daytona ツール | ~月額 ¥750 ゲートウェイ + サンドボックス idle ほぼ ¥0 | Telegram + burst automation | 2 ベンダーの監視が必要 |
| 自宅 Mac / ノート PC ゲートウェイ | 電気代のみ | 個人 dev テスト | 常時 online 必須 |
| レンタル Mac mini M4(MacXCode クラス) | 月額レンタル料(地域により異なる) | 1 台の Apple Silicon で Xcode + agent | 最安の chat-only bot ではない |
Modal はサンドボックス実行中に CPU 秒と GB 秒で課金;アイドル冬眠中はこれらの料金は発生しません。Daytona も同様の idle 休眠を謳います—本番前に各ベンダーダッシュボードで現行料金を確認してください。
Apple Mac mini 仕様は、ゲートウェイとビルドを同居させる場合のみ意味があります—serverless 端末ルーティングには不要です。
Modal 端末バックエンド
Modal が向く場合
- burst 型 shell 作業(スクリプト、
pip install、データ取得)で Telegram メッセージ間隔が数分。 - ML タスク向けオプション GPU クラス(実行中のみ課金)。
container_persistent: true時の Modal スナップショットによるファイルシステム永続化。
~/.hermes/config.yaml の設定
terminal:
backend: modal
modal_image: "nikolaik/python-nodejs:python3.11-nodejs20"
container_cpu: 1
container_memory: 5120
container_disk: 51200
container_persistent: true
前提条件(上流):
pip install modal
modal token new
hermes doctor
Modal が向かない場合:巨大 monorepo checkout 上の sub 秒ローカルファイル編集—コールドスタート + イメージ pull 遅延が効きます。リポジトリがあるマシンでは local または SSH バックエンドを使ってください。
Daytona 端末バックエンド
Daytona はツール実行をアイドル時に冬眠するクラウドサンドボックスへルーティングします(Hermes ドキュメント参照)。設定:
terminal:
backend: daytona
ゲートウェイ起動前に API キーを export:
export DAYTONA_API_KEY="your_key"
# persist in ~/.hermes/.env for launchd
Daytona が向く場合:VPS 上で Docker を管理せず serverless 永続化が欲しい—Hermes README は Modal と並べ「セッション間コストほぼゼロ」を目指します。
Daytona が向かない場合:厳格なデータ residency で on-prem のみ—クラウドサンドボックスは compliance 外です。
Telegram:太いサーバーなしで agent を起動
次の方法で Telegram を一度だけ接続(詳細はTelegram ゲートウェイガイド):
hermes gateway setup
低コストゲートウェイホスト:
- 月額 ¥750 VPS(1 GB RAM)で
hermes gateway+~/.hermes/.envのみ - Oracle Cloud 無料 tier(地域による—アカウント上限を確認)
- 実験用自宅常時起動 Mac
同一マシンで terminal.backend を modal または daytona に—ゲートウェイは軽量のまま;重い処理は serverless サンドボックスが起動して実行します。
セキュリティ:数値 TELEGRAM_ALLOWED_USERS のみ—allowlist なしで bot を公開しない(@userinfobot で ID 取得)。
Hermes vs OpenClaw vs OpenHuman 比較表で agent フレームワークを比較—OpenClaw はheadless launchd レンタルに強く、Hermes はlearning loop + Modal/Daytona オフロードに強いです。
8 ステップ手順:近ゼロ算力スタック
- Hermes インストール —
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash - モデル認証 —
hermes setup(BYO キー;OpenRouter で予算型モデルを選択してコスト管理)。 - serverless バックエンド選択 — Modal(
modal token new)または Daytona(DAYTONA_API_KEY)。 ~/.hermes/config.yaml作成 — 上記リソース制限でterminal.backend: modalまたはdaytona。- Telegram —
hermes gateway setup;~/.hermes/.envを確認。 - 軽量ゲートウェイホスト — VPS で
hermes gateway install && hermes gateway start(高価 GPU マシンではない)。 - スモークテスト — bot に「
uname -aを実行して報告」と送信—Modal/Daytona ダッシュボードでサンドボックス起停を確認。 - コストガードレール — ベンダー支出上限を設定;休暇中ゲートウェイ不要なら
hermes gateway stopを計画。
トラブルシュート
bot は「hello」に返すが Modal 認証でツール失敗
| 症状 | 修正 |
|---|---|
modal token 欠落 | ゲートウェイホストユーザーで modal token new |
| Python 環境エラー | hermes doctor;Hermes venv に modal を install |
| 古いサンドボックス | container_persistent を切替または Modal app ログをクリア |
サンドボックスは動くが Telegram 無応答
- ゲートウェイ未起動:
hermes gateway status ~/.hermes/logs/gateway.logで Telegram token エラーを確認- 1 bot token に poll できるプロセスは 1 つのみ(
Conflict: terminated by other getUpdates)
想定より費用が高い
- LLM token が大半—モデル切替、ツールループ短縮、上流 CLI ドキュメント通り chat で
/compress - Modal 永続ディスクスナップショットはストレージ課金—
container_diskを削減 - ゲートウェイ VPS が 4 GB RAM tier のまま—poll のみなら 1 GB にダウンサイズ
Modal バックエンドから MEDIA: ファイル添付失敗
ゲートウェイはホストパスからファイル送信—Modal 内では上流ドキュメント Telegram + Docker セクションのホストマウント volume パスに書き込んでください。
FAQ
hermes doctor を実行してください。太い VM なしの予算型 automation
Telegram + バースト型ツールだけなら、軽量ゲートウェイ + Modal/Daytona 冬眠は 24/7 シェルホストより安価です—Xcode 同居が必要なときだけ M4 レンタルを検討してください。