AI / Automation

2026-05-29 Hermes Agent Serverless : Modal/Daytona en veille + réveil Telegram (HK / JP / KR / SG / US)

Un VM cloud 24/7 pour un agent IA coûte souvent 5–20 €/mois avant le premier token LLM. Hermes Agent (MIT, Nous Research) cible cette douleur avec des backends terminal serverless : des sandboxes Modal et Daytona qui hibernent à l’idle et s’activent quand Hermes doit exécuter des outils shell—pendant que vous discutez depuis Telegram sur votre téléphone.

Précision importante (pour ne pas casser le budget) : l’amont distingue où la passerelle écoute (souvent un petit hôte toujours actif pour le long polling Telegram) de où tournent les commandes lourdes (Modal/Daytona). Ce guide montre l’architecture honnête la moins chère, pas « littéralement 0 € tout compris, API modèle incluse ».
Divulgation : MacXCode loue des Mac mini M4 Apple Silicon pour les équipes qui ont besoin d’un Xcode CI toujours actif ou de passerelles OpenClaw—nous ne les mentionnons qu’en contraste dans la matrice des coûts, pas comme le chemin Telegram+Hermes le moins cher.
Hermes Agent serverless Modal Daytona Telegram hibernation sur Mac mini M4 cloud loué

Le problème des coûts d’exploitation

Les fondateurs sensibles au budget et les passionnés d’automatisation voient trois postes :

PosteFourchette typiqueCe qui le drive
VM compute5–50 €/moisVPS/RDS toujours actif pour passerelle + outils
API LLM5–500+ €/moisChoix du modèle × boucles d’outils
Egress / stockage0–20 €/moisLogs, artefacts, disque Modal

Hermes n’élimine pas la dépense LLM. Il peut réduire le compute idle entre les bursts en routant l’exécution terminal vers Modal/Daytona plutôt qu’une grosse machine toujours allumée qui exécute bash 24/7.

Si vous faites déjà tourner Hermes sur un Mac mini M4 loué pour des builds iOS, consultez notre guide passerelle Telegram sur M4—cet article vise à minimiser le compute cloud, pas à maximiser la colocation Xcode.

Architecture : passerelle vs backend terminal

Résumé technique citable : La passerelle Hermes (hermes gateway) gère la messagerie ; le backend terminal (terminal.backend dans ~/.hermes/config.yaml) décide où s’exécutent bash, les outils fichiers et les scripts.

CoucheHiberne à l’idle ?Hôte typique
Passerelle Telegram (long polling)Non — les polls sortants exigent un processus actifVPS ~5 €/mois, Mac domestique ou Mac loué
Backend terminal : ModalOui — sandbox endormie entre bursts d’outilsCloud Modal
Backend terminal : DaytonaOui — sandbox endormie entre bursts d’outilsCloud Daytona
Fournisseur LLMN/A (paiement au token)OpenRouter, Nous Portal, etc.

Chemin de réveil souhaité :

  1. Vous envoyez un message Telegram à votre bot.
  2. La passerelle (sur un hôte léger) reçoit la mise à jour.
  3. La boucle agent Hermes appelle des outils → Modal/Daytona se réveille, exécute, renvoie la sortie.
  4. La sandbox hiberne à nouveau ; la passerelle peut rester active (peu de RAM).

Pour un déploiement où tout dort, la doc Telegram amont décrit le mode webhook (ingress HTTPS) sur Fly.io/Railway—plus difficile sur une location Mac SSH-only. Le long polling par défaut est plus simple mais exige un processus passerelle toujours actif.

Références officielles : Terminal backends, Configuration Telegram, GitHub README.

Matrice de décision coûts (4 lignes)

ModèleCompute idle mensuelIdéal pourCompromis
Gros VPS 24/7~5–12 € (1 vCPU)Modèle mental le plus simplePaye pendant que vous dormez
Passerelle VPS légère + outils Modal/Daytona~5 € passerelle + sandboxes idle quasi 0 €Telegram + automatisation par burstsDeux fournisseurs à surveiller
Passerelle Mac / laptop domestiqueÉlectricité seulementTests solo devDoit rester en ligne
Mac mini M4 loué (classe MacXCode)Frais de location (mensuel régional)Xcode + agent sur un hôte Apple SiliconPas le bot chat le moins cher

Modal facture au CPU-seconde et GB-seconde quand les sandboxes tournent ; les périodes hibernées idle évitent ces charges. Daytona propose un comportement sleep-when-idle similaire—vérifiez la tarification actuelle sur chaque tableau de bord avant la production.

Les spécifications Mac mini Apple ne comptent que si vous colocalisez passerelle et builds—pas requis pour le routage terminal serverless.

Quand Modal convient

  • Travail shell par bursts (scripts, pip install, pulls de données) avec minutes entre messages Telegram.
  • Classes GPU optionnelles pour tâches ML (payé uniquement pendant les runs).
  • Persistance filesystem via snapshots Modal quand container_persistent: true.

Configurer ~/.hermes/config.yaml

terminal: backend: modal modal_image: "nikolaik/python-nodejs:python3.11-nodejs20" container_cpu: 1 container_memory: 5120 container_disk: 51200 container_persistent: true

Prérequis (amont) :

pip install modal modal token new hermes doctor

Quand Modal est inadapté : éditions fichiers locales sub-seconde sur un énorme monorepo—latence cold start + pull d’image. Utilisez le backend local ou SSH sur une machine qui a déjà le dépôt.

Backend terminal Daytona

Daytona route l’exécution d’outils vers des sandboxes cloud qui hibernent à l’idle (doc Hermes). Définir :

terminal: backend: daytona

Exporter la clé API avant de démarrer la passerelle :

export DAYTONA_API_KEY="your_key" # persist in ~/.hermes/.env for launchd

Quand Daytona convient : vous voulez la persistance serverless sans gérer Docker sur un VPS—le README Hermes place Daytona aux côtés de Modal pour « coût quasi nul entre sessions ».

Quand Daytona est inadapté : exigences strictes de résidence des données on-prem uniquement—les sandboxes cloud sortent du périmètre compliance.

Telegram : réveiller l’agent sans gros serveur

Brancher Telegram une fois (étapes complètes dans notre guide passerelle Telegram) :

hermes gateway setup

Hôtes passerelle low-cost :

  • VPS ~5 €/mois (1 Go RAM) exécutant uniquement hermes gateway + ~/.hermes/.env
  • Oracle Cloud free tier (si disponible dans votre région—vérifiez les limites compte)
  • Mac domestique toujours actif pour les expérimentations

Pointez terminal.backend vers modal ou daytona sur la même machine—la passerelle reste légère ; le travail lourd réveille les sandboxes serverless.

Sécurité : TELEGRAM_ALLOWED_USERS numériques uniquement—n’exposez jamais le bot sans liste blanche (@userinfobot pour votre ID).

Comparez les frameworks agent dans notre matrice Hermes vs OpenClaw vs OpenHuman—OpenClaw excelle sur les leases headless launchd ; Hermes sur le learning loop + offload Modal/Daytona.

Runbook en 8 étapes : stack compute quasi idle

  1. Installer Hermescurl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
  2. Auth modèlehermes setup (clés BYO ; modèles budget sur OpenRouter pour maîtriser les coûts).
  3. Choisir le backend serverless — Modal (modal token new) ou Daytona (DAYTONA_API_KEY).
  4. Écrire ~/.hermes/config.yaml — définir terminal.backend: modal ou daytona avec les limites de ressources ci-dessus.
  5. Telegramhermes gateway setup ; confirmer ~/.hermes/.env.
  6. Hôte passerelle léger — déployer hermes gateway install && hermes gateway start sur VPS (pas sur une machine GPU coûteuse).
  7. Test fumée — message au bot : « exécute uname -a et rapporte »—surveillez le tableau Modal/Daytona pour start/stop sandbox.
  8. Garde-fous coûts — plafonds de dépense fournisseur ; planifier hermes gateway stop en vacances si la passerelle n’est pas nécessaire.

Dépannage

Le bot répond « hello » mais les outils échouent avec erreurs auth Modal

SymptômeCorrectif
modal token manquantExécuter modal token new sous l’utilisateur de l’hôte passerelle
Mauvais env Pythonhermes doctor ; installer modal dans le venv Hermes
Sandbox obsolèteBasculer container_persistent ou vider les logs app Modal

La sandbox tourne mais Telegram reste silencieux

  • Passerelle inactive : hermes gateway status
  • Vérifier ~/.hermes/logs/gateway.log pour erreurs token Telegram
  • Un seul processus peut poller un token bot (Conflict: terminated by other getUpdates)

Coûts plus élevés que prévu

  • Les tokens LLM dominent—changer de modèle, raccourcir les boucles d’outils, utiliser /compress en chat selon la doc CLI amont
  • Les snapshots disque persistant Modal facturent encore le stockage—réduire container_disk
  • VPS passerelle laissé en palier 4 Go RAM—descendre à 1 Go si polling seulement

Les pièces jointes MEDIA: échouent depuis le backend Modal

La passerelle envoie les fichiers depuis des chemins hôte—dans Modal, écrire vers un chemin volume monté hôte documenté dans la section Telegram + Docker de la doc amont.

FAQ

La dépense mensuelle peut-elle être littéralement 0 € ?+
Peu probable de bout en bout. Le compute Modal/Daytona idle peut approcher 0 €, mais un hôte passerelle (~5 €/mois VPS), Telegram et l’usage API LLM coûtent généralement encore. Les free tiers changent—vérifiez les pages fournisseurs chaque mois.
Toute la stack Hermes hiberne-t-elle quand Telegram est idle ?+
Les sandboxes terminal oui. La passerelle en long polling par défaut reste éveillée sauf passage en hébergement webhook ou arrêt du service.
Modal ou Daytona ?+
Modal si vous voulez classes GPU/CPU et persistance snapshot dans un seul écosystème. Daytona si vous préférez leur UX sandbox—exécutez hermes doctor après configuration.
Est-ce un remplacement pour un Mac mini M4 loué ?+
Non pour Xcode CI. Oui pour une automatisation Telegram personnelle où Apple Silicon et disque 24/7 sont inutiles.
Où est la documentation serverless officielle ?+
Hermes terminal backends et README NousResearch/hermes-agent (six backends : local, Docker, SSH, Singularity, Modal, Daytona).

Automation budget sans gros VM

Quand Telegram + outils par bursts suffisent, une passerelle légère + veille Modal/Daytona coûte moins qu'un shell 24/7—ne louez un M4 que si la colocation Xcode est nécessaire.