Метка: тестирование

Как собрать десктопный бенчмарк для LLM на Gemini 3.5 Flash за два промпта

4 июля 2026

Задача: написать десктопное приложение для тестирования скорости локальных LLM с графиками и сравнением моделей. Это нетривиально, потому что кроссплатформенная разработка требует связки фронтенда на Vue 3 и бэкенда на Rust через Tauri. Мы соберем этот инструмент с нуля всего за два запроса, протестировав в реальном бою новую модель Gemini 3.5 Flash в обновленной среде разработки … Читать далее

Сравниваем Qwen 3.6 и Gemma 4: битва локальных LLM в кодинге

15 мая 2026

Выбор локальной модели для автогенерации кода часто сводится к скучному чтению бенчмарков. Проблема в том, что абстрактные цифры не покажут способность нейросети написать рабочее приложение с нуля. Ниже мы стравливаем две плотные модели Qwen 3.6 27B и Gemma 4 31B в боевых условиях, заставляя их самостоятельно собрать десктопный Markdown-редактор с разделенным экраном. Подготовка к эксперименту … Читать далее

Локальный ИИ для кода: тестируем Qwen 3.6 27B на реальных задачах

9 мая 2026

Платные облачные нейросети стоят денег и читают ваши проприетарные исходники. Локальные модели долгое время годились только для простых скриптов. Ситуация изменилась: берем свежий релиз Qwen 3.6 и проверяем, способен ли он писать готовый к проду код без бесконечных правок. Спойлер: способен, если взять правильную версию. Почему плотная архитектура 27B лучше 35B Решение: качаем веса модели … Читать далее

Запускаем Gemma 4 на Raspberry Pi 5

30 апреля 202627 апреля 2026

Локальные нейросети обычно требуют мощных видеокарт и внушительных объемов памяти. Мы пойдем другим путем и попытаемся поднять свежую Gemma 4 от Google на обычной «малинке». Посмотрим, сможет ли Raspberry Pi 5 вытянуть модель на 2 миллиарда параметров и остаться в живых, раздавая API для внешних редакторов кода. Что понадобится: Подготовка сервера и установка LM Studio … Читать далее

Тестируем локальный запуск нейросети Gemma 4

30 апреля 202624 апреля 2026

Google выпустил новую линейку открытых нейросетей Gemma 4. Главная фишка релиза кроется в лицензии Apache 2.0. Для разработчиков это означает отсутствие привязки к корпоративным API, нулевой vendor lock-in и возможность легально крутить ИИ на собственном железе без риска слить конфиденциальные данные в чужое облако. Разбираемся с производительностью модели в боевых условиях на обычном макбуке и … Читать далее

Тестирование локальных ИИ-моделей до 9B на агентские задачи

24 апреля 202619 апреля 2026

Все хотят запустить локальную нейронку, отдать ей доступ к консоли и уйти пить кофе. Желательно, чтобы она при этом не удалила продакшен и умела дергать внешние API. Ребята из ServerFlow прогнали через тесты пачку мелких моделей от 3 до 9 миллиардов параметров, чтобы понять, кто реально тянет tool calling, а кто уходит в бесконечный цикл. … Читать далее