AI / Automation

2026-05-29 Hermes Agent Serverless: Modal/Daytona Hibernate + Telegram-Aufwecken (HK / JP / KR / SG / US)

Ein 24/7-Cloud-VM für einen KI-Agenten kostet oft 5–20 €/Monat, bevor ein einziger LLM-Token anfällt. Hermes Agent (MIT, Nous Research) adressiert das mit serverless Terminal-Backends: Modal- und Daytona-Sandboxes, die bei Idle hibernieren und hochfahren, wenn Hermes Shell-Tools ausführen muss—während Sie vom Telegram-Handy chatten.

Wichtige Präzision (damit Budgets nicht platzen): Upstream trennt wo die Gateway lauscht (oft ein kleiner Always-on-Host für Telegram-Long Polling) von wo schwere Befehle laufen (Modal/Daytona). Dieser Leitfaden zeigt die günstigste ehrliche Architektur, nicht „buchstäblich 0 € für alles inklusive Modell-API“.
Hinweis: MacXCode vermietet Apple-Silicon-Mac-mini-M4-Hosts für Teams mit Always-on-Xcode-CI oder OpenClaw-Gateways—wir nennen Mieten nur als Kontrast in der Kostenmatrix, nicht als günstigsten Telegram+Hermes-Weg.
Hermes Agent Serverless Modal Daytona Telegram Hibernate auf gemietetem Cloud-Mac-mini-M4

Das Betriebskosten-Problem

Budgetbewusste Gründer und Automation-Hobbyisten sehen drei Posten:

KostenpositionTypische SpanneTreiber
Compute-VM5–50 €/MonatVPS/RDS dauerhaft für Gateway + Tools
LLM-API5–500+ €/MonatModellwahl × Tool-Schleifen
Egress / Storage0–20 €/MonatLogs, Artefakte, Modal-Disk

Hermes eliminiert LLM-Kosten nicht. Es kann Idle-Compute zwischen Bursts reduzieren, indem Terminal-Ausführung zu Modal/Daytona geroutet wird statt eine fette Always-on-Box mit 24/7-bash.

Wenn Sie Hermes bereits auf einem gemieteten Mac mini M4 für iOS-Builds betreiben, siehe unseren Telegram-Gateway-auf-M4-Leitfaden—dieser Artikel zielt auf minimale Cloud-Compute-Kosten, nicht maximale Xcode-Kolokation.

Architektur: Gateway vs Terminal-Backend

Zitierfähige Kurzfassung: Das Hermes-Gateway (hermes gateway) übernimmt Messaging; das Terminal-Backend (terminal.backend in ~/.hermes/config.yaml) entscheidet, wo bash, Datei-Tools und Skripte laufen.

SchichtBei Idle hibernieren?Typischer Host
Telegram-Gateway (Long Polling)Nein — ausgehende Polls brauchen laufenden Prozess~5 € VPS, Heim-Mac oder Miet-Mac
Terminal-Backend: ModalJa — Sandbox schläft zwischen Tool-BurstsModal-Cloud
Terminal-Backend: DaytonaJa — Sandbox schläft zwischen Tool-BurstsDaytona-Cloud
LLM-ProviderN/A (Pay-per-Token)OpenRouter, Nous Portal usw.

Gewünschter Wake-Pfad:

  1. Sie senden eine Telegram-Nachricht an Ihren Bot.
  2. Gateway (auf schlankem Host) empfängt das Update.
  3. Hermes-Agent-Schleife ruft Tools → Modal/Daytona wacht, führt Befehle aus, liefert Output.
  4. Sandbox hiberniert wieder; Gateway kann aktiv bleiben (wenig RAM).

Für echtes Alles-schlafen beschreiben Upstream-Telegram-Docs Webhook-Modus (HTTPS-Ingress) auf Fly.io/Railway—schwerer bei SSH-only-Mac-Mieten. Standard-Long Polling ist einfacher, braucht aber Always-on-Gateway-Prozess.

Offizielle Referenzen: Terminal backends, Telegram setup, GitHub README.

Kosten-Entscheidungsmatrix (4 Zeilen)

MusterMonatliches Idle-ComputeAm besten fürTrade-off
Fetter VPS 24/7~5–12 € (1 vCPU)Einfachstes MentalmodellZahlt im Schlaf
Schlankes VPS-Gateway + Modal/Daytona-Tools~5 € Gateway + idle Sandboxes fast 0 €Telegram + burstige AutomationZwei Anbieter überwachen
Heim-Mac / Laptop-GatewayNur StromSolo-Dev-TestsMuss online bleiben
Gemieteter Mac mini M4 (MacXCode-Klasse)Mietgebühr (regional monatlich)Xcode + Agent auf einem Apple-Silicon-HostNicht der günstigste Chat-only-Bot

Modal berechnet CPU-Sekunden und GB-Sekunden bei laufenden Sandboxes; idle hibernierte Phasen vermeiden diese Gebühren. Daytona wirbt mit ähnlichem Sleep-when-idle—aktuelle Preise vor Produktion auf jedem Dashboard prüfen.

Apple-Mac-mini-Specs zählen nur bei Kolokation von Gateway und Builds—nicht nötig für serverless Terminal-Routing.

Wann Modal passt

  • Burstige Shell-Arbeit (Skripte, pip install, Data Pulls) mit Minuten zwischen Telegram-Nachrichten.
  • Optionale GPU-Klassen für ML-Tasks (nur während Runs zahlen).
  • Filesystem-Persistenz via Modal-Snapshots bei container_persistent: true.

~/.hermes/config.yaml konfigurieren

terminal: backend: modal modal_image: "nikolaik/python-nodejs:python3.11-nodejs20" container_cpu: 1 container_memory: 5120 container_disk: 51200 container_persistent: true

Voraussetzungen (upstream):

pip install modal modal token new hermes doctor

Wann Modal falsch ist: Sub-Sekunden-Lokaldatei-Edits auf riesigem Monorepo-Checkout—Cold-Start + Image-Pull-Latenz. local- oder SSH-Backend auf Maschine mit Repo nutzen.

Daytona Terminal-Backend

Daytona routet Tool-Ausführung zu Cloud-Sandboxes, die bei Idle hibernieren (laut Hermes-Docs). Setzen:

terminal: backend: daytona

API-Key vor Gateway-Start exportieren:

export DAYTONA_API_KEY="your_key" # persist in ~/.hermes/.env for launchd

Wann Daytona passt: serverless Persistenz ohne Docker auf VPS—Hermes README stellt Daytona neben Modal für „Kosten fast null zwischen Sessions“.

Wann Daytona falsch ist: strikte Data-Residency nur on-prem—Cloud-Sandboxes fallen aus Compliance.

Telegram: Agent ohne fetten Server wecken

Telegram einmal verdrahten (volle Schritte in unserem Telegram-Gateway-Leitfaden):

hermes gateway setup

Günstige Gateway-Hosts:

  • ~5 €/Monat VPS (1 GB RAM) nur mit hermes gateway + ~/.hermes/.env
  • Oracle Cloud Free Tier (falls in Ihrer Region—Kontolimits prüfen)
  • Heim-Always-on-Mac für Experimente

terminal.backend auf derselben Maschine auf modal oder daytona—Gateway bleibt leicht; schwere Arbeit weckt serverless Sandboxes.

Sicherheit: nur numerische TELEGRAM_ALLOWED_USERS—Bot nie ohne Allowlist exponieren (@userinfobot für Ihre ID).

Agent-Frameworks in unserer Matrix Hermes vs OpenClaw vs OpenHuman vergleichen—OpenClaw stark bei headless launchd-Mieten; Hermes bei Learning Loop + Modal/Daytona-Offload.

Acht-Schritte-Runbook: Near-Idle-Compute-Stack

  1. Hermes installierencurl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
  2. Modell-Authhermes setup (BYO-Keys; Budget-Modelle auf OpenRouter für Kostenkontrolle).
  3. Serverless-Backend wählen — Modal (modal token new) oder Daytona (DAYTONA_API_KEY).
  4. ~/.hermes/config.yaml schreibenterminal.backend: modal oder daytona mit Ressourcenlimits oben.
  5. Telegramhermes gateway setup; ~/.hermes/.env bestätigen.
  6. Schlankes Gatewayhermes gateway install && hermes gateway start auf VPS (nicht auf teurer GPU-Box).
  7. Smoke-Test — Bot-Nachricht: „führe uname -a aus und berichte“—Modal/Daytona-Dashboard auf Sandbox Start/Stop beobachten.
  8. Kosten-Leitplanken — Provider-Ausgabenlimits; hermes gateway stop im Urlaub planen, wenn Gateway nicht nötig.

Fehlerbehebung

Bot antwortet „hello“, Tools scheitern mit Modal-Auth-Fehlern

SymptomFix
modal token fehltmodal token new unter Gateway-Host-User ausführen
Falsches Python-Envhermes doctor; modal in Hermes-venv installieren
Veraltete Sandboxcontainer_persistent umschalten oder Modal-App-Logs leeren

Sandbox läuft, Telegram schweigt

  • Gateway nicht aktiv: hermes gateway status
  • ~/.hermes/logs/gateway.log auf Telegram-Token-Fehler prüfen
  • Nur ein Prozess darf Bot-Token pollen (Conflict: terminated by other getUpdates)

Kosten höher als erwartet

  • LLM-Tokens dominieren—Modell wechseln, Tool-Schleifen kürzen, /compress im Chat laut Upstream-CLI-Docs
  • Modal-persistente Disk-Snapshots berechnen Storage—container_disk trimmen
  • Gateway-VPS auf 4-GB-RAM-Tier—auf 1 GB downsizen bei nur Polling

MEDIA:-Anhänge scheitern vom Modal-Backend

Gateway sendet Dateien von Host-Pfaden—in Modal auf host-gemounteten Volume-Pfad schreiben, dokumentiert in Telegram + Docker der Upstream-Docs.

FAQ

Kann die monatliche Ausgabe buchstäblich 0 € sein?+
End-to-end unwahrscheinlich. Idle-Modal/Daytona-Compute kann 0 € nähern, aber Gateway-Host (~5 € VPS), Telegram und LLM-API kosten meist noch. Free Tiers ändern sich—Vendor-Seiten monatlich prüfen.
Hiberniert der gesamte Hermes-Stack bei Telegram-Idle?+
Terminal-Sandboxes ja. Das Gateway für Standard-Long-Polling bleibt wach, außer Webhook-Hosting oder Service-Stopp.
Modal oder Daytona?+
Modal für GPU/CPU-Klassen und Snapshot-Persistenz in einem Ökosystem. Daytona bei bevorzugter Sandbox-UX—nach Konfiguration hermes doctor ausführen.
Ersatz für gemieteten Mac mini M4?+
Nein für Xcode CI. Ja für persönliche Telegram-Automation, wo Apple Silicon und 24/7-Disk unnötig sind.
Wo ist die offizielle Serverless-Dokumentation?+
Hermes terminal backends und NousResearch/hermes-agent README (sechs Backends: local, Docker, SSH, Singularity, Modal, Daytona).

Budget-Automation ohne fetten VM

Wenn Telegram + burstige Tools reichen, schlägt schlankes Gateway + Modal/Daytona-Hibernate 24/7-Shell-Hosts—M4-Miete nur bei nötiger Xcode-Kolokation.