AI / DevTools

Claude Code 利用を約4倍Headroom MCP 予算最適化(2026-06-04

実リポで Claude Code を回すインディー開発者なら分かる痛み:grep、テストログ、MCP ツール出力が毎回コンテキストに戻り、Anthropic は入出力トークン課金Headroom(Apache 2.0、2026年中 GitHub 1万+スター)はモデル前にツール出力・ログ・ファイル・RAG チャンクをローカル圧縮。公開 workload で 60–95% トークン削減、README デモではログの FATAL 検索が 10,144 → 1,260 トークンで同答えと主張。

本稿は headroom wrap claudeMCP サーバー実請求計算+セットアップ—Claude 置換の誇大広告ではなく、一度見た stderr メガバイトにフル運賃を払うのをやめる話。

開示: MacXCode はヘッドレス CI とエージェントゲートウェイ用に Apple Silicon Mac を貸出。Headroom はお使いのマシンで動作;当社は Headroom サービスを運用しません。
Headroom MCP Claude Code 予算最適化セットアップ

エンジニアリング repo で Claude Code 予算が燃える理由

Claude Code の強み—エンジニアのように repo を読む—がメーターでもある:

  • ツール出力インフレ — 大規模モノレポで bash・検索・MCP が1ターン 1万–8万トークン
  • 再送コンテキスト — 圧縮なしで旧ツール塊がスレッドに残り、45分リファクタで費用が複利。
  • MCP スプロール — 各サーバーが JSON を追加;うるさいツール3つで入力トークンが
引用フレーズ: Headroom は Claude のトークン単価を下げない—ツールと API の間を圧縮し、課金対象トークンを小さくする。

ハーネス選定中なら Codex CLI vs Claude Code ベンチ2026 エージェント比較—本稿は Claude Code 済みでマージンを取り戻す方向。

アーキテクチャ — Headroom の位置

Claude Code (or Cursor / Codex via wrap) │ tool calls · logs · file reads ▼ ┌──────────────────────────────────────┐ │ Headroom (local — Python 3.10+) │ │ CacheAligner → ContentRouter → CCR │ │ SmartCrusher (JSON) │ │ CodeCompressor (AST) │ │ Kompress-base (text) │ │ MCP: compress · retrieve · stats │ └──────────────────────────────────────┘ │ compressed context + retrieve tool ▼ Anthropic API (Claude)

  • CCR(可逆) — 原文はローカル保存;モデルは headroom_retrieve で逐語取得可。
  • MCP モードheadroom_compressheadroom_retrieveheadroom_stats を任意 MCP クライアントへ。
  • プロキシモードheadroom proxy --port 8787、OpenAI 互換クライアントはコード変更ゼロ

公式: headroom-docs.vercel.app · ソース: github.com/chopratejas/headroom

請求比較マトリクス — 公開 workload vs「素の Claude Code」

Headroom 公開の前後表は計画数字—repo を保証しません。自分の $/MTok を掛けてドル化。

Workload(Headroom ドキュメント)圧縮前圧縮後削減インディー向け意味
コード検索(100件)17,7651,40892%重い rg/検索日は1セッション=$20からコーヒー代へ
SRE インシデント65,6945,11892%--verbose を省略せずログ切り分け
GitHub issue トリアージ54,17414,76173%Max プランでも issue ボットが現実的に
コードベース探索78,50241,25447%依然価値あり;広い読み取りは圧縮率低め

示意月次計算(仮定)

Sonnet 級 ~$3/MTok 入力 と仮定(Anthropic 現行ページ要確認):

シナリオ生トークン/月約75%節約後入力 $(生)入力 $(Headroom)
Solo indie (50M in)50M12.5M$150~$38
Small team (200M in)200M50M$600~$150
"Log hell" week (+30M logs)30M3M (90% on logs)$90~$9

タイトルの 4倍利用ドル予算一定 で平均約75%節約 ≈ 同額で約4倍ターン—無制限ではない。

シナリオ A — headroom wrap claude(最短ルート)

向いている人:ターミナルで毎日 Claude Code(Mac/Linux);MCP.json を触らない。

# Python 3.10+ required pip install "headroom-ai[all]" # One-command wrap (starts compression + optional memory) headroom wrap claude # After a session, inspect savings headroom perf

変わる点: Headroom が API 前にツール出力とコンテキストを横取り。UX はそのまま;裸 claude ではなく wrap で起動。

もし X なら Y: もし レンタル Mac で obra Superpowers 済みなら、なら 同一ホストに Headroom — obra Superpowers セットアップ;Headroom は直交(圧縮 vs 手順)。

シナリオ B — Claude Code + カスタムツール向け MCP

向いている人:MCP を厳選し compress/retrieve を第一級ツールにしたいチーム。

pip install "headroom-ai[mcp]" # Install MCP config for supported clients headroom mcp install

Claude Code MCP 設定(典型—最新ドキュメントで確認):

{ "mcpServers": { "headroom": { "command": "headroom", "args": ["mcp", "serve"] } } }

得られる MCP ツール:

ツール役割
headroom_compressチャット投入前にブロブを縮小
headroom_retrieveCCR ストアから原文取得
headroom_statsトークン節約テレメトリ

もし X なら Y: MCP が巨大 JSON を返すなら、Claude が要約するに Headroom 経由。

シナリオ C — 混合スタック向けプロキシ

headroom proxy --port 8787 # Point OpenAI-compatible clients at http://127.0.0.1:8787

Claude Code と並行で Codex、Aider、スクリプト を回し、圧縮を一層にまとめたいとき。

ステップ・ランブック — 最初の有効な1時間

  1. インストールpip install "headroom-ai[all]"
  2. ベースライン — Headroom なしで1タスク;Anthropic で入力トークンを記録。
  3. wrap 有効化headroom wrap claude;同じタスクを繰り返す。
  4. 比較headroom perf検索/ログ重いタスクで最大。
  5. MCP(任意)— headroom mcp install
  6. 期待値 — 探索型は ~47%
  7. CCR ドリルheadroom_retrieve で可逆性確認。
  8. スキップ — CI に Python なし;レンタル Mac で proxy。

トラブルシュート

headroom wrap claude が Claude Code を起動しない

症状: command not found: claude
対処: Claude Code CLI;wrap 前に which claude

小ファイルで節約がほぼ 0%

大 repo で rg または CI ログで試す。

圧縮後にモデルが詳細を見落とし

headroom_retrieve(CCR)で原文を取得。

MCP headroom が赤

headroom mcp serve の stderr を確認。

推奨パス

状況やること
ソロ、ターミナルのみ Claude Codeheadroom wrap claude + 週次 headroom perf
MCP 多(5+)MCP install + 最大ペイロードサーバーから
混合エージェントのチーム共有 Mac mini で headroom proxy
Max 予算が厳しいまず ログ/検索(ドキュメント最大 92%
中国本土開発者必要なら pip ミラー;HK/SG レンタル Mac

FAQ

Headroom は Claude Code や Anthropic 課金を置き換える?+
いいえ。Anthropic へのモデル課金は継続。Headroom は入力サイズ(特にツール出力)を削減。
「60–95% 節約」は保証?+
いいえ。47–92%。計画平均 75% であり SLA ではない。
コードは Headroom のクラウドに送られる?+
ローカル実行。コンプライアンスは headroom-docs limitations。
RTK や lean-ctx との違い?+
全コンテキスト種別を可逆 CCR で圧縮;HEADROOM_CONTEXT_TOOL=lean-ctx 統合可。
レンタル Mac mini M4 で動く?+
はい—SSH で headroom wrap claudeクラウド Mac ランナー
中国本土—人民元請求?+
Anthropic は USD;$112/月節約 ≈ ¥806(¥7.2/USD 示意)。

レンタル Mac で Headroom を実行

HK/JP/KR/SG/US の Apple Silicon—wrap・MCP・CI を同一ホストで、購入不要。