Лимиты в Google Antigravity: как не слить квоту за 40 минут

Начинаете кодить в Google Antigravity, запускаете агента, а через 40 минут ловите блокировку. ИИ-ассистент уходит в отпуск на неделю, оставляя вас один на один с репозиторием. Разберем механику квот и настроим рабочий процесс так, чтобы лимитов хватало надолго.

Как на самом деле считаются лимиты

Главная ошибка — думать, что расход считается в токенах. В Antigravity лимиты зависят от вычислительной мощности (work done), которую тратит языковая модель. Автодополнение кода работает бесплатно, а простые вопросы в чат почти ничего не стоят. Зато планирование архитектуры, редактирование множества файлов и сканирование всего репозитория съедают квоту мгновенно. Самый быстрый способ слить лимит — запустить автоматизацию браузера или циклы в терминале.

Два счетчика и множители моделей

В системе параллельно тикают два счетчика для каждого провайдера. Первый представляет собой скользящее окно на 5 часов и 250 единиц. Второй является скрытой недельной квотой на 2800 единиц. Тратите вы их всегда одновременно. Если базовая квота исчерпана, придется писать код руками до конца недели, даже если пятичасовой таймер обнулился.

Скорость сжигания лимита зависит от коэффициента выбранной модели. Базовая ставка закреплена за Claude Sonnet.

  • Claude Sonnet расходует лимит с коэффициентом 1x.
  • Claude Opus сжигает квоту со скоростью 8x.
  • Gemini 3.1 Pro работает с множителем 1.5x.
  • Gemini Flash потребляет всего 0.1x от базы.

За что дают мгновенный бан

Платформа категорически не прощает две вещи. Первая — бесконечные циклы в терминале. Если выдать агенту права на постоянное выполнение кода, он может уйти в рекурсивную отладку и сжечь недельную квоту за один промпт. Вторая — интеграция сторонних инструментов автоматизации. Попытка прикрутить n8n для отправки запросов снаружи моментально вознаграждается жесткой блокировкой учетной записи.

Стратегии экономии лимитов

Мы пишем код, чтобы поменьше работать, а не чтобы воевать с ограничениями платформы. Следующие подходы помогут растянуть квоту на долгие часы продуктивной разработки.

Подбор модели и размера контекста

Не используйте Claude Opus для написания шаблонного кода, оставьте эту модель для сложного логического проектирования. Claude Sonnet отлично справляется с ролью повседневного инструмента, а Gemini Flash блестяще пишет код по готовым инструкциям.

Ограничивайте размер контекста. Не заставляйте агента сканировать десятки файлов ради исправления одного эндпоинта. Используйте прямые упоминания файлов для точечной работы.

StoDum
@api_controller.js исправь логику валидации данных

Ротация и состояние сессии

Квоты Anthropic и Google разделены. Если вы уперлись в лимит моделей Claude, просто переключитесь на пул моделей Gemini.

Самая дорогая ошибка — тянуть за собой огромную историю переписки, так как раздутый контекст удорожает каждый следующий запрос. Перед сменой модели или закрытием сессии заставьте агента сохранить состояние.

StoDum
Сгенерируй hand-off документ. Опиши, что мы уже сделали, на каком этапе остановились, какие решения приняли и какие шаги нужно выполнить дальше.

В новой сессии просто отдайте этот файл агенту, чтобы не загружать прошлую историю общения.

Внешнее планирование

Самый ресурсоемкий процесс для ИИ внутри IDE — это размышления «на лету». Вынесите этап планирования в сторонние веб-сервисы с мощными моделями. Попросите ИИ продумать архитектуру и составить подробный список задач.

StoDum
Спроектируй архитектуру сервиса. Выдай подробный пошаговый To-Do лист для написания кода без дополнительных размышлений.

Перенесите этот готовый список в Google Antigravity и отдайте самой дешевой модели Gemini Flash. Ей больше не нужно думать, она просто напишет код по готовой инструкции практически бесплатно.