DeepMind ускорил генерацию в 4 раза и перенес ИИ на локальное железо
Новая архитектура DiffusionGemma ускорит генерацию текста на локальных видеокартах в четыре раза, перекладывая нагрузку с памяти на вычислительную мощность.
Google DeepMind — одна из самых известных и влиятельных компаний в мире искусственного интеллекта. Основанная в 2010 году в Лондоне как DeepMind Technologies, компания стала символом прорыва в разработке ИИ-систем, способных решать сложные задачи, от игр до биологических исследований. В 2014 году она была приобретена Google за сумму, оцениваемую от $400 до $650 миллионов, что стало одним из ключевых событий в истории развития технологий искусственного интеллекта.
Архитектурный сдвиг: от последовательности к параллелизму
Google DeepMind представила модель DiffusionGemma, которая меняет подход к генерации текста. Вместо привычного посимвольного набора, где каждый новый символ зависит от предыдущего, новая архитектура формирует текст параллельными блоками. Это решение переносит узкое место с пропускной способности памяти на вычислительную мощность процессора. На локальных видеокартах скорость генерации выросла в четыре раза. Модель уже доступна для скачивания на платформе Hugging Face под лицензией Apache 2.0 и входит в семейство Gemma 4.
Важный нюанс: Переход к блочной генерации меняет экономику владения ИИ. Бизнесу больше не обязательно арендовать дорогие облачные мощности для быстрого вывода текста; задача решается на стандартном «железе», если у него достаточно вычислительной производительности.
Техническая реализация опирается на архитектуру Mixture of Experts (смесь экспертов). Система активирует лишь 3,8 миллиарда параметров из общего пула в 26 миллиардов, что позволяет модели работать в 18 ГБ оперативной памяти. Тесты на ускорителях Nvidia H100 показали скорость до 1000 токенов в секунду. Однако технология пока не внедрена в облачные модели Gemini. Причиной служит риск потери смысла всего блока текста при ошибке в одном токене, что делает метод пока непригодным для задач, требующих абсолютной точности в каждом слове.
Инфраструктурная гонка и кадровый обмен
Развитие алгоритмов неразрывно связано с доступом к вычислительным ресурсам. Google направляет значительные инвестиции в расширение мощностей для DeepMind, стремясь удваивать их каждые полгода. В 2026 году капитальные вложения компании достигли $185 млрд. Этот рост создает высокий барьер входа для новых игроков и усиливает доминирование тех, кто контролирует как софт, так и «железо». В то же время, европейский рынок реагирует на эту динамику созданием суверенной инфраструктуры. Стартап Mistral AI, основанный бывшими исследователями DeepMind, привлек $830 млн на строительство дата-центров в Париже и Швеции. Цель — обеспечить 200 мегаватт мощности к 2027 году и снизить зависимость от американских облачных гигантов.
Кадровый обмен между лабораториями остается ключевым драйвером инноваций. Google активно возвращает бывших специалистов, включая Ноама Шахареля и Даниэля де Фрейтаса, для усиления разработки моделей Gemini. Параллельно Microsoft и другие конкуренты переманивают таланты из DeepMind, формируя собственные команды. В Великобритании расходы DeepMind на персонал в 2024 году выросли до £1,01 млрд, что отражает жесткую конкуренцию за квалифицированные кадры.
От кода к физическому миру
Фокус исследований смещается от текстовых задач к решению проблем в реальном мире. Google DeepMind интегрировала платформу Intrinsic в свою экосистему, объединив её с моделями Gemini. Это позволяет заводам перестраивать производство за считанные клики, делая адаптивных роботов доступными для среднего бизнеса. Совместно с Boston Dynamics компания ускоряет создание гуманоидного робота Atlas, предоставляя ему фундаментальные модели ИИ. Новые модели Gemini Robotics 1.5 и Gemini Robotics-ER 1.5 позволяют роботам планировать действия на несколько шагов вперед, использовать поисковые системы для получения информации и переносить навыки между разными устройствами.
Стоит учесть: Успех в робототехнике теперь зависит не от одного алгоритма, а от глубокой интеграции «мозга» и «нервной системы». Стартапы вынуждены объединяться с чипмейкерами, так как создание автономных машин силами одного игрока становится невозможным.
В сфере безопасности ИИ-агент CodeMender за полгода внес 72 подтвержденных исправления в открытые проекты, обработав более 4 млн строк кода. Система автоматически выявляет уязвимости, объединяя анализ кода и фаззинг. В энергетике DeepMind сотрудничает с Commonwealth Fusion Systems для оптимизации термоядерного реактора Sparc. Алгоритмы машинного обучения анализируют сотни параметров плазмы, что недоступно человеку, и помогают стабилизировать процесс.
Риски и ограничения развития
Несмотря на прогресс, отрасль сталкивается с серьезными вызовами. Исследователи из Стэнфорда и Йельского университетов обнаружили, что коммерческие модели, включая Gemini 2.5 Pro, способны запоминать и воспроизводить защищенный контент. Это ставит под вопрос юридическую защиту принципа «справедливого использования». Генеральный директор DeepMind Демис Хасабис предупредил о риске пузыря на рынке ИИ-стартапов, где высокие оценки не подкреплены реальными коммерческими активами.
Вопросы достижения общего искусственного интеллекта (AGI) остаются предметом дискуссий. Дженсен Хуанг утверждает, что AGI уже наступил, указывая на появление автономных агентов. В то же время Google DeepMind прогнозирует достижение этого уровня к 2030 году, демонстрируя более сдержанный подход. Разрыв в вычислительных мощностях между США и Китаем сохраняется, что ограничивает возможности китайских разработчиков. Блокировка западных платформ в Китае стимулировала рост локальных решений, таких как DeepSeek и Qwen, но технологическое отставание в доступе к ресурсам остается фактором.
На фоне этого: Нестабильность результатов, как в случае с моделью Veo 3, которая успешно решает задачи, но допускает ошибки в логике, указывает на то, что ИИ еще не достиг уровня надежного универсального помощника. Эти сбои рассматриваются как признак потенциала, но они ограничивают применение в критически важных сферах.
Для российского рынка эти процессы означают изменение глобальных цепочек поставок технологий и доступности вычислительных ресурсов. Ускорение перехода к локальным решениям и открытым лицензиям, как в случае с DiffusionGemma, может стать сигналом для отечественных разработчиков. Возможность запускать мощные модели на собственном оборудовании снижает зависимость от зарубежных облачных сервисов. Однако риск утечки данных и юридические коллизии с авторским правом требуют внимательного мониторинга при внедрении подобных решений.
🤖 Сводка сформирована нейросетью на основе фактов из Календаря. Мы обновляем аналитический дайджест при необходимости — факты и хронология всегда доступны в Календаре ниже для проверки и изучения.
📅 Последнее обновление сводки: 23 июня 2026.