AI / DevTools

×4 использования Claude Code: бюджет Headroom MCP (2026-06-04)

Инди-разработчики с Claude Code на реальных репозиториях знают боль: каждый grep, лог тестов и дамп MCP возвращается в контекст—Anthropic считает токены ввода и вывода. Headroom (Apache 2.0, 10k+ звёзд на GitHub к середине 2026) локально сжимает вывод инструментов, логи, файлы и RAG-чанки до модели; в опубликованных workload на 60–95 % меньше токенов, в README-демо 10 144 → 1 260 токенов для FATAL в логах.

Это реальная математика счетов + гайд по установке для headroom wrap claude и MCP-сервера—не хайп заменить Claude, а перестать платить полную цену за мегабайты stderr, которые вы уже видели.

Раскрытие: MacXCode сдаёт Mac на Apple Silicon для headless CI и шлюзов агентов. Headroom работает на вашей машине; мы не оказываем Headroom как сервис.
Настройка бюджета Headroom MCP Claude Code

Почему Claude Code сжигает бюджет на инженерных репозиториях

Сила Claude Code—читать репо как инженер—также и счётчик:

  • Раздувание вывода инструментовbash, поиск и MCP могут давать 10k–80k токенов за ход на больших монорепо.
  • Повторный контекст — блоки инструментов остаются в треде; затраты растут за 45-минутный рефакторинг.
  • Разрастание MCP — каждый сервер добавляет JSON; три «шумных» инструмента могут удвоить входные токены хода.
Цитата: Headroom не делает Claude дешевле за токен—он уменьшает то, что считается токеном, сжимая всё между инструментами и API.

Ещё выбираете harness? См. Codex CLI vs Claude Code и сравнение агентов 2026—статья для тех, кто уже на Claude Code и хочет вернуть маржу.

Архитектура — где стоит Headroom

Claude Code (or Cursor / Codex via wrap) │ tool calls · logs · file reads ▼ ┌──────────────────────────────────────┐ │ Headroom (local — Python 3.10+) │ │ CacheAligner → ContentRouter → CCR │ │ SmartCrusher (JSON) │ │ CodeCompressor (AST) │ │ Kompress-base (text) │ │ MCP: compress · retrieve · stats │ └──────────────────────────────────────┘ │ compressed context + retrieve tool ▼ Anthropic API (Claude)

  • CCR (обратимый) — оригиналы локально; модель может вызвать headroom_retrieve для дословного текста.
  • Режим MCPheadroom_compress, headroom_retrieve, headroom_stats для любого MCP-клиента.
  • Режим проксиheadroom proxy --port 8787 для OpenAI-совместимых клиентов без изменения кода.

Документация: headroom-docs.vercel.app · Исходники: github.com/chopratejas/headroom.

Матрица счетов — опубликованные workload vs «голый Claude Code»

Используйте опубликованную таблицу Headroom до/после как плановые цифры—не гарантия для вашего репо. Умножьте на ваш $/MTok.

Workload (доки)ДоПослеЭкономияДля инди
Поиск по коду (100)17,7651,40892%Тяжёлые дни rg: с ~$20/сессия до «на кофе»
SRE-инцидент65,6945,11892%Разбор логов без отказа от --verbose
Триаж GitHub issues54,17414,76173%Боты issues на Max
Исследование кодовой базы78,50241,25447%Всё ещё полезно; широкое чтение сжимается слабее

Иллюстративный месячный расчёт (гипотетический)

Допустим ~$3/MTok ввода уровня Sonnet (проверьте актуальные тарифы Anthropic):

СценарийСырые/мес~75 % эффект.$ ввода сыро$ с Headroom
Solo indie (50M in)50M12.5M$150~$38
Small team (200M in)200M50M$600~$150
"Log hell" week (+30M logs)30M3M (90% on logs)$90~$9

×4 использования в заголовке: при фиксированном долларовом бюджете ~75 % экономии ≈ ~×4 ходов за те же деньги—не магический безлимит.

Сценарий A — headroom wrap claude (самый быстрый путь)

Для: ежедневный Claude Code в терминале.

# Python 3.10+ required pip install "headroom-ai[all]" # One-command wrap (starts compression + optional memory) headroom wrap claude # After a session, inspect savings headroom perf

Headroom перехватывает вывод инструментов и контекст до API.

Если X, то Y: obra на арендованном Mac → Headroom на том же хосте: установка obra.

Сценарий B — MCP

Команды с курируемыми MCP.

pip install "headroom-ai[mcp]" # Install MCP config for supported clients headroom mcp install

Конфиг MCP Claude Code:

{ "mcpServers": { "headroom": { "command": "headroom", "args": ["mcp", "serve"] } } }

Инструменты MCP:

ИнструментРоль
headroom_compressСжать blob до чата
headroom_retrieveОригинал из CCR
headroom_statsТелеметрия экономии

Огромный JSON → сначала Headroom.

Сценарий C — прокси

headroom proxy --port 8787 # Point OpenAI-compatible clients at http://127.0.0.1:8787

Один слой сжатия для смешанных стеков.

Runbook — первый продуктивный час

  1. Установкаpip install "headroom-ai[all]".
  2. Базовая линия — без Headroom; входные токены.
  3. Wrapheadroom wrap claude.
  4. Сравнениеheadroom perf.
  5. MCPheadroom mcp install.
  6. Ожидания — ~47 %.
  7. CCRheadroom_retrieve.
  8. Пропустить — proxy на арендованном Mac.

Устранение неполадок

wrap не запускает Claude Code

CLI сначала.

Экономия ~0 %

Тест rg на большом репо.

Пропущена деталь

headroom_retrieve.

MCP красный

headroom mcp serve.

Рекомендации

СитуацияДействие
Соло, только Terminalheadroom wrap claude + еженед. headroom perf
Много MCP (5+)MCP install + самый тяжёлый сервер
Команда со смешанными агентамиheadroom proxy на общем Mac mini
Жёсткий бюджет MaxСначала логи/поиск (до 92 %)
Континентальный КитайЗеркало pip; аренда HK/SG

FAQ

Headroom заменяет Claude Code или Anthropic?+
Нет. Уменьшает размер ввода.
60–95 % гарантировано?+
Нет. 47–92 %. Планируйте 75 %.
Код в облако Headroom?+
Локально по доке.
Отличие от RTK/lean-ctx?+
Все типы контекста ; обратимый CCR.
Арендованный Mac mini M4?+
CNY?+
USD ; ~$112/мес ≈ ¥806.

Headroom на арендованном Mac

Apple Silicon HK/JP/KR/SG/US—wrap, MCP и CI на одном хосте без покупки.