Тестирование локальных ИИ-моделей до 9B на агентские задачи

Все хотят запустить локальную нейронку, отдать ей доступ к консоли и уйти пить кофе. Желательно, чтобы она при этом не удалила продакшен и умела дергать внешние API. Ребята из ServerFlow прогнали через тесты пачку мелких моделей от 3 до 9 миллиардов параметров, чтобы понять, кто реально тянет tool calling, а кто уходит в бесконечный цикл. … Читать далее

Обзор модели Gemma 4 31B IT. Тесты на логику, код и зрение

Google недавно выкатила новую open-source модель Gemma 4 31B, и мы решили проверить, на что она реально способна. В меню заявлены встроенное зрение и режим рассуждения. Посмотрим, сможет ли она писать нормальный код, не завалить школьную математику и потягаться с популярными китайскими аналогами. Характеристики и запуск через Docker Модель на 31 миллиард параметров уже неплохо … Читать далее

Лимиты в Google Antigravity: как не слить квоту за 40 минут

Начинаете кодить в Google Antigravity, запускаете агента, а через 40 минут ловите блокировку. ИИ-ассистент уходит в отпуск на неделю, оставляя вас один на один с репозиторием. Разберем механику квот и настроим рабочий процесс так, чтобы лимитов хватало надолго. Как на самом деле считаются лимиты Главная ошибка — думать, что расход считается в токенах. В Antigravity … Читать далее