×4 использования Claude Code: бюджет Headroom MCP (2026-06-04)
Инди-разработчики с Claude Code на реальных репозиториях знают боль: каждый grep, лог тестов и дамп MCP возвращается в контекст—Anthropic считает токены ввода и вывода. Headroom (Apache 2.0, 10k+ звёзд на GitHub к середине 2026) локально сжимает вывод инструментов, логи, файлы и RAG-чанки до модели; в опубликованных workload на 60–95 % меньше токенов, в README-демо 10 144 → 1 260 токенов для FATAL в логах.
Это реальная математика счетов + гайд по установке для headroom wrap claude и MCP-сервера—не хайп заменить Claude, а перестать платить полную цену за мегабайты stderr, которые вы уже видели.
Почему Claude Code сжигает бюджет на инженерных репозиториях
Сила Claude Code—читать репо как инженер—также и счётчик:
- Раздувание вывода инструментов —
bash, поиск и MCP могут давать 10k–80k токенов за ход на больших монорепо. - Повторный контекст — блоки инструментов остаются в треде; затраты растут за 45-минутный рефакторинг.
- Разрастание MCP — каждый сервер добавляет JSON; три «шумных» инструмента могут удвоить входные токены хода.
Ещё выбираете harness? См. Codex CLI vs Claude Code и сравнение агентов 2026—статья для тех, кто уже на Claude Code и хочет вернуть маржу.
Архитектура — где стоит Headroom
Claude Code (or Cursor / Codex via wrap)
│ tool calls · logs · file reads
▼
┌──────────────────────────────────────┐
│ Headroom (local — Python 3.10+) │
│ CacheAligner → ContentRouter → CCR │
│ SmartCrusher (JSON) │
│ CodeCompressor (AST) │
│ Kompress-base (text) │
│ MCP: compress · retrieve · stats │
└──────────────────────────────────────┘
│ compressed context + retrieve tool
▼
Anthropic API (Claude)
- CCR (обратимый) — оригиналы локально; модель может вызвать
headroom_retrieveдля дословного текста. - Режим MCP —
headroom_compress,headroom_retrieve,headroom_statsдля любого MCP-клиента. - Режим прокси —
headroom proxy --port 8787для OpenAI-совместимых клиентов без изменения кода.
Документация: headroom-docs.vercel.app · Исходники: github.com/chopratejas/headroom.
Матрица счетов — опубликованные workload vs «голый Claude Code»
Используйте опубликованную таблицу Headroom до/после как плановые цифры—не гарантия для вашего репо. Умножьте на ваш $/MTok.
| Workload (доки) | До | После | Экономия | Для инди |
|---|---|---|---|---|
| Поиск по коду (100) | 17,765 | 1,408 | 92% | Тяжёлые дни rg: с ~$20/сессия до «на кофе» |
| SRE-инцидент | 65,694 | 5,118 | 92% | Разбор логов без отказа от --verbose |
| Триаж GitHub issues | 54,174 | 14,761 | 73% | Боты issues на Max |
| Исследование кодовой базы | 78,502 | 41,254 | 47% | Всё ещё полезно; широкое чтение сжимается слабее |
Иллюстративный месячный расчёт (гипотетический)
Допустим ~$3/MTok ввода уровня Sonnet (проверьте актуальные тарифы Anthropic):
| Сценарий | Сырые/мес | ~75 % эффект. | $ ввода сыро | $ с Headroom |
|---|---|---|---|---|
| Solo indie (50M in) | 50M | 12.5M | $150 | ~$38 |
| Small team (200M in) | 200M | 50M | $600 | ~$150 |
| "Log hell" week (+30M logs) | 30M | 3M (90% on logs) | $90 | ~$9 |
×4 использования в заголовке: при фиксированном долларовом бюджете ~75 % экономии ≈ ~×4 ходов за те же деньги—не магический безлимит.
Сценарий A — headroom wrap claude (самый быстрый путь)
Для: ежедневный Claude Code в терминале.
# Python 3.10+ required
pip install "headroom-ai[all]"
# One-command wrap (starts compression + optional memory)
headroom wrap claude
# After a session, inspect savings
headroom perf
Headroom перехватывает вывод инструментов и контекст до API.
Если X, то Y: obra на арендованном Mac → Headroom на том же хосте: установка obra.
Сценарий B — MCP
Команды с курируемыми MCP.
pip install "headroom-ai[mcp]"
# Install MCP config for supported clients
headroom mcp install
Конфиг MCP Claude Code:
{
"mcpServers": {
"headroom": {
"command": "headroom",
"args": ["mcp", "serve"]
}
}
}
Инструменты MCP:
| Инструмент | Роль |
|---|---|
headroom_compress | Сжать blob до чата |
headroom_retrieve | Оригинал из CCR |
headroom_stats | Телеметрия экономии |
Огромный JSON → сначала Headroom.
Сценарий C — прокси
headroom proxy --port 8787
# Point OpenAI-compatible clients at http://127.0.0.1:8787
Один слой сжатия для смешанных стеков.
Runbook — первый продуктивный час
- Установка —
pip install "headroom-ai[all]". - Базовая линия — без Headroom; входные токены.
- Wrap —
headroom wrap claude. - Сравнение —
headroom perf. - MCP —
headroom mcp install. - Ожидания — ~47 %.
- CCR —
headroom_retrieve. - Пропустить — proxy на арендованном Mac.
Устранение неполадок
wrap не запускает Claude Code
CLI сначала.
Экономия ~0 %
Тест rg на большом репо.
Пропущена деталь
headroom_retrieve.
MCP красный
headroom mcp serve.
Рекомендации
| Ситуация | Действие |
|---|---|
| Соло, только Terminal | headroom wrap claude + еженед. headroom perf |
| Много MCP (5+) | MCP install + самый тяжёлый сервер |
| Команда со смешанными агентами | headroom proxy на общем Mac mini |
| Жёсткий бюджет Max | Сначала логи/поиск (до 92 %) |
| Континентальный Китай | Зеркало pip; аренда HK/SG |