Как больше никогда не превышать лимит сессии Claude

Source
en-origru
Apr 20, 2026 May 15, 2026
Video preview
Share:

В этом видео Нейт делится практическими советами и стратегиями, которые помогут вам эффективно управлять токенами и избегать превышения лимита сессии в Claude Code.

Что такое контекст и как работают токены ⏱ 0:00

  • Контекст — это всё, что Claude Code видит в данный момент: системный промпт, вся история диалога, каждый вызов инструмента, каждый вывод инструмента, каждый прочитанный файл, каждый навык, MCP-сервер или агент в проекте. Это как текущая рабочая память Claude.
  • Токен — это наименьшая единица текста, которую AI-модель читает и за которую взимает плату. Примерно один токен равен одному слову.
  • Каждый раз, когда вы отправляете сообщение, Claude перечитывает весь диалог с начала — это экспоненциально увеличивает затраты токенов.
  • Один разработчик отследил чат из 100+ сообщений и обнаружил, что 98,5% всех токенов были потрачены на перечитывание старых сообщений.
  • Контекстная гниль и автосжатие ⏱ 3:33

  • Контекстная гниль — это AI-деменция: когда сессия растёт, производительность модели ухудшается, она отвлекается, забывает, противоречит себе, редактирует файлы без чтения, становится нечёткой.
  • Точность поиска падает с 92% при 256 000 токенов до 78% при 1 миллионе токенов.
  • Автосжатие включается около 95% заполнения окна, но сохраняет лишь 20–30% исходных деталей. Это слишком поздно, так как автосжатие срабатывает на пике контекстной гнили.
  • Решение — ручное сжатие на 60% заполнения окна (около 250 000 токенов).
  • Пять опций после ответа Claude и /rewind ⏱ 6:06

  • Пять опций: продолжить (continue), /rewind, /clear (начать заново), /compact (суммировать сессию и заменить историю сводкой), отправить сообщения саб-агенту.
  • /rewind — самая важная привычка. Двойное нажатие Escape или команда /rewind возвращают к предыдущему сообщению, удаляя всё после него. Это очищает контекст от неудачных попыток и сломанного кода.
  • При /rewind есть опция «сделать краткую сводку отсюда», которая создаёт передаточное сообщение от будущего Claude к прошлому с тем, что выяснили.
  • Метод Нейта: компакт и ручное сжатие ⏱ 8:36

  • Нейт не использует /compact. Вместо этого он ждёт до 120 000 токенов (12% окна для Opus с 1 млн токенов), просит Claude: «Дай полную сводку всего, что мы сделали, и текущего статуса следующего шага». Затем копирует сводку, делает /clear и вставляет её.
  • Ключ: хранить данные в трекерных листах, логах активности, списках задач, чтобы при сбросе сессии не потерять важное.
  • Нейт создал навык /session handoff, который автоматизирует этот процесс: анализирует всё, выдаёт сводку с решениями, файлами для следующей сессии, состоянием, вопросами. После копирования и /clear сессия полностью переориентируется.
  • Саб-агенты и практические советы ⏱ 10:37

  • Саб-агенты получают свежее окно контекста, выполняют работу и возвращают результат в основную сессию. Можно явно указывать: «Запусти саб-агента для проверки» или «для обзора кодовой базы».
  • Саб-агенты могут использовать более дешёвую модель (Haiku), что экономит токены.
  • Следите за лимитом сессии в десктопном приложении. Если осталось 50% и сессия скоро сбросится, используйте агрессивно. Если близко к концу — сделайте перерыв.
  • Конвертируйте файлы в Markdown: HTML → 90% меньше токенов, PDF → 65–70% меньше, DOCX → 33% меньше. Используйте инструменты вроде Docling.
  • /btw (или /by the way) — открывает оверлей для быстрых вопросов, не добавляя их в историю диалога.
  • Всегда начинайте сессию с плана (plan mode). Вложите токены в чёткий план, чтобы избежать исправлений. Это дешевле.
  • Claude.md должен быть не длиннее 200 строк (~2 000 токенов). Переносите специализированные инструкции в контекстные файлы, которые подгружаются по требованию. Используйте .claudeignore для исключения папок/файлов.
  • Выходные токены дороже входных, но просьба «будь кратким» не сильно влияет на общий расход.
  • Токен-дашборд и большая философия ⏱ 16:14

  • Нейт создал кастомный токен-дашборд (репозиторий в его бесплатном сообществе). Он показывает сессии, витки, входные/выходные токены, кэш чтения/создания за 7 или 30 дней по моделям, проектам, инструментам.
  • Можно просматривать конкретные промпты и анализировать, почему потрачено так много токенов.
  • Статистика: анализ 18 000 блоков размышлений из 7 000 сессий показал, что глубина размышлений падает на 67% с ростом сессии, а «редактирование без чтения» растёт с 6% до 34%.
  • Один пользователь увеличил расходы с 345$ до 42 000$ в месяц, но качество осталось прежним.
  • Не стремитесь заполнить 1 млн токенов. 0–20% сессии — «прайм-тайм». Нейт никогда не превышает 120 000 токенов (12%).
  • Используйте сессионный конвейер: отдельная сессия для исследования, планирования, выполнения.
  • Существуют готовые фреймворки (10 репозиториев на GitHub), которые могут сократить расход токенов на 60–90%. Примеры: Rust Token Killer, Context Mode, Token Savior, Claude Token Efficient. Не нужно использовать все — проанализируйте и выберите 2–3.
  • Если сессия пошла плохо, просто откройте новую.
  • Ключевые выводы

  • Каждое сообщение заставляет Claude перечитывать всю историю диалога, что приводит к экспоненциальному росту затрат токенов — до 98,5% токенов может уходить на повторное чтение.
  • Контекстная гниль снижает точность поиска с 92% (256k токенов) до 78% (1 млн токенов); для борьбы с ней используйте ручное сжатие на ~250k токенов, а не автосжатие при 95%.
  • /rewind — лучшая практика: позволяет удалить неудачные попытки из контекста, сохраняя чистоту истории.
  • Конвертация файлов в Markdown сокращает количество токенов на 33–90% (HTML, PDF, DOCX).
  • Не стремитесь заполнить окно в 1 млн токенов — 0–20% сессии являются наиболее эффективными; Нейт рекомендует не превышать 120 000 токенов.
  • Один пользователь увеличил ежемесячные расходы с $345 до $42 000 без улучшения качества из-за плохого управления контекстом.
  • Заключение

    Применяя эти привычки последовательно, вы сможете избегать превышения лимита сессии и получать больше от подписки Claude Code.

    Visual Highlightsbeta