Сравниваем Qwen 3.6 и Gemma 4: битва локальных LLM в кодинге

Выбор локальной модели для автогенерации кода часто сводится к скучному чтению бенчмарков. Проблема в том, что абстрактные цифры не покажут способность нейросети написать рабочее приложение с нуля. Ниже мы стравливаем две плотные модели Qwen 3.6 27B и Gemma 4 31B в боевых условиях, заставляя их самостоятельно собрать десктопный Markdown-редактор с разделенным экраном. Подготовка к эксперименту … Читать далее

Локальный ИИ для кода: тестируем Qwen 3.6 27B на реальных задачах

Платные облачные нейросети стоят денег и читают ваши проприетарные исходники. Локальные модели долгое время годились только для простых скриптов. Ситуация изменилась: берем свежий релиз Qwen 3.6 и проверяем, способен ли он писать готовый к проду код без бесконечных правок. Спойлер: способен, если взять правильную версию. Почему плотная архитектура 27B лучше 35B Решение: качаем веса модели … Читать далее

Запускаем Gemma 4 на Raspberry Pi 5

Локальные нейросети обычно требуют мощных видеокарт и внушительных объемов памяти. Мы пойдем другим путем и попытаемся поднять свежую Gemma 4 от Google на обычной «малинке». Посмотрим, сможет ли Raspberry Pi 5 вытянуть модель на 2 миллиарда параметров и остаться в живых, раздавая API для внешних редакторов кода. Что понадобится: Подготовка сервера и установка LM Studio … Читать далее

Тестируем локальный запуск нейросети Gemma 4

Google выпустил новую линейку открытых нейросетей Gemma 4. Главная фишка релиза кроется в лицензии Apache 2.0. Для разработчиков это означает отсутствие привязки к корпоративным API, нулевой vendor lock-in и возможность легально крутить ИИ на собственном железе без риска слить конфиденциальные данные в чужое облако. Разбираемся с производительностью модели в боевых условиях на обычном макбуке и … Читать далее

Тестирование локальных ИИ-моделей до 9B на агентские задачи

Все хотят запустить локальную нейронку, отдать ей доступ к консоли и уйти пить кофе. Желательно, чтобы она при этом не удалила продакшен и умела дергать внешние API. Ребята из ServerFlow прогнали через тесты пачку мелких моделей от 3 до 9 миллиардов параметров, чтобы понять, кто реально тянет tool calling, а кто уходит в бесконечный цикл. … Читать далее