Gemma 4
Gemma 4 в новостной повестке, календарь упоминаний и aналитика в реальном времени.
Календарь упоминаний:
Gemma 4: запуск DiffusionGemma с параллельной генерацией текста
Суть: Google представила модель DiffusionGemma в семействе Gemma 4, использующую диффузионный подход для параллельной генерации блоков текста вместо последовательного авто регрессивного метода.
Событие: Модель с 26 миллиардами параметров (3,8 млрд активных) доступна для скачивания на платформе Hugging Face под лицензией Apache 2.0.
Эффект: На видеокарте RTX 5090 скорость генерации достигает 700 токенов в секунду, что в четыре раза быстрее аналогичных авто регрессивных моделей Gemma.
Фактор: Архитектура Mixture of Experts позволяет разместить систему в 18 ГБ оперативной памяти, перенеся узкое место с пропускной способности памяти на вычислительную мощность.
Риск: Для генерации коротких ответов диффузионные модели тратят больше ресурсов, а ошибка в одном блоке может сделать весь
текст бессмысленным.
Расширение возможностей локального ИИ через переход на открытую лицензию Apache 2.0
Корпорация Google представила семейство моделей Gemma 4, заменив проприетарную лицензию на Apache 2.0 для устранения юридических барьеров и стимулирования развития экосистемы Gemmaverse. Семь версий алгоритмов, от оптимизированных для смартфонов Effective 2B и 4B до мощных серверных 26B MoE и 31B Dense, обеспечивают работу на локальном оборудовании с минимальными задержками и поддержкой более 140 языков. Эти модели позволяют выполнять сложные задачи, включая генерацию кода и анализ визуальных данных, в офлайн-режиме, что снижает зависимость от облачных сервисов. Переход на гибкую лицензию дает компаниям полный контроль над данными и стратегиями развертывания, устраняя риски одностороннего изменения правил использования.
Gemma 4 имеет 2 записи событий в нашей базе.