ЭФИР В СРЕДУЗакрытое AI-комьюнити EdgeLab Space – библиотека, живой чат, эфиры по средам.
Claude Code · 27
AI-агенты без кода: с чего всё начинаетсяТир-лист AI-инструментов 2026Что такое AGENTS.md и как написать свой в 2026Что такое Claude Code в 2026: простыми словами и как начатьИИ-агент в 2026: что умеет и как запустить свой за 3 дняClaude Code и API в 2026: подписка или ключ, что выбрать и сколько стоитКоманды Claude Code 2026, которые экономят часыClaude Code и GitHub в 2026: автоматизация PR, ревью и ActionsЛимиты Claude Code 2026: как не упиратьсяМаркетинговые скиллы для Claude Code 2026: как активироватьКак установить скилл в Claude Code 2026: пошаговоСкиллы Claude Code под профессии 2026: не только для кодаСкиллы для Claude Code 2026: сотни бесплатных навыковClaude Code Starter KitВоркшоп «AI-агент ClaudeCode за 3 дня»LLM Council 2026: как заставить Claude спорить с собойClaude Cowork – автопилот для вашей работыCLAUDE.md 2026: память и правила для Claude Code (метод Карпати)Бесплатный Claude Code 2026: 3 рабочих способаКак установить Claude Code в 2026: Windows, Mac, Linux пошаговоКак начать внедрять AI-агентов в работуНейросети для программирования в 2026: 7 ИИ-инструментов и какой выбратьПромпт-инжиниринг в 2026: как писать запросы, чтобы ИИ делал что нужноRuflo – как экономить до 75% токенов в Claude CodeSonnet или Opus в Claude Code 2026: какую модель выбрать и когдаВайб-кодинг в 2026: что это и как начать кодить с ИИ без программированияСвой AI-агент на VPS за 3 шага
Лимиты Claude Code 2026: как не упираться
Гайды / Claude Code / Гайд

Лимиты Claude Code 2026: как не упираться

Почему Claude Code упирается в лимит и начинает тупить: что забивает контекст, как работают плановые лимиты, команды /context /compact /usage и карта проекта вместо перечитывания файлов.

Коротко

Claude Code тупит и упирается в лимит по двум причинам: переполненное контекстное окно и плановая квота. Разбираем, что забивает контекст (чтение файлов – главный драйвер), команды диагностики /context /compact /usage и как держать карту проекта вместо перечитывания всего подряд.

Claude Code начинает тупить и упираться в лимит не случайно. За этим стоят два разных механизма, и оба управляемы. Если понять, что забивает контекст и как работают плановые лимиты, упираться вы будете в разы реже.

Два разных лимита

Их легко спутать, но это разные вещи:

  • Контекстное окно – рабочая память одной сессии. На каждом ходу Claude заново получает всю историю: разговор, прочитанные файлы, вывод команд. Когда окно забивается – качество падает, ответы плывут.
  • Плановый лимит – квота вашего тарифа. Работает как скользящее окно в 5 часов плюс отдельный недельный лимит со сбросом по расписанию (видно в Settings → Usage). Если квота кончается слишком быстро, а на платный тариф пока не готовы – есть рабочие способы запустить Claude Code бесплатно.

Связь между ними прямая: раздутый контекст сжигает плановую квоту быстрее, потому что каждый ход обрабатывает больше токенов. Экономия контекста экономит и квоту.

Что забивает контекст

Главный драйвер роста – чтение файлов. Каждый прочитанный файл остаётся в контексте до /clear или /compact. Один большой файл, открытый в начале, оплачивается токенами на каждом следующем ходу.

Что ещё растёт быстро:

  • Вывод команд и инструментов. Даже если в терминале видна одна строка, модель может получить весь вывод целиком.
  • Вставленный текст. Всё, что вы вставили прямо в промпт, висит в контексте до конца сессии.
  • Ответы MCP-серверов. Один «взорвавшийся» MCP-вызов способен съесть заметную часть окна.

А ещё при старте сессии, до первого слова, уже загружены системные инструкции, ваш CLAUDE.md, автопамять и описания скиллов. Поэтому раздутый CLAUDE.md – это лишние токены в каждой сессии.

СОВЕТ · Совет

Размер окна сейчас – порядка 200K токенов, у части моделей до 1М, и числа меняются с каждым обновлением. Не ориентируйтесь на цифры из спецификаций – единственный честный источник для текущей сессии это команда /context.

Три команды диагностики

Прежде чем бороться с лимитом – посмотрите, на что он уходит.

  • /context – показывает, чем занят контекст: цветная карта с разбивкой по компонентам. Запускайте до того, как окно набилось, а не после.
  • /compact – сжимает историю в саммари и освобождает место, сохраняя важное. Можно задать фокус: /compact focus on API changes. Для продолжения той же задачи.
  • /usage – расход токенов и плановые лимиты, с разбивкой по скиллам, субагентам, плагинам и MCP-серверам. Сразу видно пожирателей.

И отдельно /clear – полная очистка контекста. При переключении на новую задачу это эффективнее компакции: сбрасывает накопленное начисто.

ВНИМАНИЕ · Важно

Если один файл или вывод настолько большой, что контекст заполняется сразу после компакции, Claude Code перестаёт автосжимать и падает с ошибкой. Не лейте огромные сырые выводы в основной поток – выносите их в субагент или в файл.

Карта проекта вместо перечитывания

Ключевая идея экономии – дать Claude компактную карту проекта, а не заставлять перечитывать весь код. Это и есть разница между «упёрся в лимит» и «работает ровно».

Anthropic называет это context engineering. Рабочая структура:

  • Корневой CLAUDE.md (держать до ~200 строк): назначение проекта, карта директорий, команды сборки и тестов, конвенции, «сюда не лезть».
  • ARCHITECTURE.md или REPO_MAP.md: компоненты, потоки данных, точки входа, «горячие» файлы.
  • DECISIONS.md: ключевые архитектурные решения, по абзацу на каждое.
  • Вложенные CLAUDE.md по папкам: локальные правила, грузятся только при работе в этой директории.

Принцип – минимум высокосигнальных токенов вместо чтения всего подряд. Тяжёлые процедуры (деплой, миграции) выносите в скиллы: они загружаются только по вызову, а не висят в контексте всегда.

СОВЕТ · Совет

Ссылка через @файл может втянуть в контекст весь файл вместе с его деревом CLAUDE.md. Если нужен только путь – укажите его текстом, это экономнее.

Субагенты как изоляция

Самый мощный рычаг экономии – субагенты. Субагент работает в отдельном контекстном окне и возвращает в основную сессию только итог. Он может прочитать тысячи токенов, а назад отдать пару сотен – резюме.

Куда это просится:

  • Поиск по большому репозиторию – субагент читает, отдаёт выжимку.
  • Прогон тестов – видит весь вывод, возвращает только упавшие.
  • Изучение документации и веб-ресёрч.

Так основной контекст остаётся чистым, а тяжёлая работа уходит в изолированные окна.

MCP-блоат

MCP-серверы – частый скрытый пожиратель. Два вектора: схемы инструментов (по умолчанию грузятся лениво, но при неверной настройке платятся каждый ход) и размер вывода (предупреждение после 10 000 токенов, лимит по умолчанию 25 000, настраивается через MAX_MCP_OUTPUT_TOKENS).

Найти виновника: /usage покажет разбивку по серверам, /mcp – список, где можно отключить лишние.

Чек-лист, чтобы не упираться

  • Смотри /context заранее, а не когда уже встало.
  • /clear при смене задачи, /compact – чтобы продолжить ту же.
  • Держи CLAUDE.md компактным – это карта, а не свалка.
  • Тяжёлое чтение и тесты – в субагенты.
  • Не вставляй большие тексты – давай путь к файлу.
  • Раз в неделю проверяй /usage и отключай ненужные MCP.

Итог

Лимит Claude Code – не стена, а следствие того, как вы кормите контекст. Дайте модели карту вместо горы файлов, выносите тяжёлое в субагенты, чистите контекст вовремя – и упираться будете в разы реже, а квота протянет дольше. Если хочется выжать максимум из тарифа, дальше идёт оптимизация токенов через Ruflo – она снимает до 75% расхода.

Хочешь научиться строить такие карты проекта и работать с агентами без потолка по контексту? В сообществе EdgeLab разбираем это на практике: эфиры, шаблоны, поддержка.

Узнай больше в сообществе EdgeLab Space – edgelab.space

FAQ

Почему Claude Code тупит и упирается в лимит?

Две причины: переполненное контекстное окно и плановая квота. Главный драйвер переполнения — чтение файлов: агент затягивает в контекст слишком много.

Как не упираться в лимиты Claude Code?

Держать карту проекта вместо перечитывания всего подряд и пользоваться диагностикой: /context (что в окне), /compact (сжать), /usage (квота). В гайде — как чистить контекст по ходу.

Дальше – вместе с сообществом
Гайд прочитан. Внедрять – проще не в одиночку, а в закрытом AI-комьюнити.
Библиотека готовых скиллов и юзкейсов для Claude и Codex
Живой чат, где общаются и люди, и их агенты
Эфиры по средам и готовые решения под реальные задачи
Вступить в EdgeLab Space →1490 ₽/месМгновенный доступ. Отмена в один клик.
В чате сейчас 320+ участников и их агенты