Google DeepMind

23 июня 2026 | Живая аналитика

DeepMind ускорил генерацию в 4 раза и перенес ИИ на локальное железо

Новая архитектура DiffusionGemma ускорит генерацию текста на локальных видеокартах в четыре раза, перекладывая нагрузку с памяти на вычислительную мощность.

Google DeepMind — одна из самых известных и влиятельных компаний в мире искусственного интеллекта. Основанная в 2010 году в Лондоне как DeepMind Technologies, компания стала символом прорыва в разработке ИИ-систем, способных решать сложные задачи, от игр до биологических исследований. В 2014 году она была приобретена Google за сумму, оцениваемую от $400 до $650 миллионов, что стало одним из ключевых событий в истории развития технологий искусственного интеллекта.

Архитектурный сдвиг: от последовательности к параллелизму

Google DeepMind представила модель DiffusionGemma, которая меняет подход к генерации текста. Вместо привычного посимвольного набора, где каждый новый символ зависит от предыдущего, новая архитектура формирует текст параллельными блоками. Это решение переносит узкое место с пропускной способности памяти на вычислительную мощность процессора. На локальных видеокартах скорость генерации выросла в четыре раза. Модель уже доступна для скачивания на платформе Hugging Face под лицензией Apache 2.0 и входит в семейство Gemma 4.

Важный нюанс: Переход к блочной генерации меняет экономику владения ИИ. Бизнесу больше не обязательно арендовать дорогие облачные мощности для быстрого вывода текста; задача решается на стандартном «железе», если у него достаточно вычислительной производительности.

Техническая реализация опирается на архитектуру Mixture of Experts (смесь экспертов). Система активирует лишь 3,8 миллиарда параметров из общего пула в 26 миллиардов, что позволяет модели работать в 18 ГБ оперативной памяти. Тесты на ускорителях Nvidia H100 показали скорость до 1000 токенов в секунду. Однако технология пока не внедрена в облачные модели Gemini. Причиной служит риск потери смысла всего блока текста при ошибке в одном токене, что делает метод пока непригодным для задач, требующих абсолютной точности в каждом слове.

Инфраструктурная гонка и кадровый обмен

Развитие алгоритмов неразрывно связано с доступом к вычислительным ресурсам. Google направляет значительные инвестиции в расширение мощностей для DeepMind, стремясь удваивать их каждые полгода. В 2026 году капитальные вложения компании достигли $185 млрд. Этот рост создает высокий барьер входа для новых игроков и усиливает доминирование тех, кто контролирует как софт, так и «железо». В то же время, европейский рынок реагирует на эту динамику созданием суверенной инфраструктуры. Стартап Mistral AI, основанный бывшими исследователями DeepMind, привлек $830 млн на строительство дата-центров в Париже и Швеции. Цель — обеспечить 200 мегаватт мощности к 2027 году и снизить зависимость от американских облачных гигантов.

Кадровый обмен между лабораториями остается ключевым драйвером инноваций. Google активно возвращает бывших специалистов, включая Ноама Шахареля и Даниэля де Фрейтаса, для усиления разработки моделей Gemini. Параллельно Microsoft и другие конкуренты переманивают таланты из DeepMind, формируя собственные команды. В Великобритании расходы DeepMind на персонал в 2024 году выросли до £1,01 млрд, что отражает жесткую конкуренцию за квалифицированные кадры.

От кода к физическому миру

Фокус исследований смещается от текстовых задач к решению проблем в реальном мире. Google DeepMind интегрировала платформу Intrinsic в свою экосистему, объединив её с моделями Gemini. Это позволяет заводам перестраивать производство за считанные клики, делая адаптивных роботов доступными для среднего бизнеса. Совместно с Boston Dynamics компания ускоряет создание гуманоидного робота Atlas, предоставляя ему фундаментальные модели ИИ. Новые модели Gemini Robotics 1.5 и Gemini Robotics-ER 1.5 позволяют роботам планировать действия на несколько шагов вперед, использовать поисковые системы для получения информации и переносить навыки между разными устройствами.

Стоит учесть: Успех в робототехнике теперь зависит не от одного алгоритма, а от глубокой интеграции «мозга» и «нервной системы». Стартапы вынуждены объединяться с чипмейкерами, так как создание автономных машин силами одного игрока становится невозможным.

В сфере безопасности ИИ-агент CodeMender за полгода внес 72 подтвержденных исправления в открытые проекты, обработав более 4 млн строк кода. Система автоматически выявляет уязвимости, объединяя анализ кода и фаззинг. В энергетике DeepMind сотрудничает с Commonwealth Fusion Systems для оптимизации термоядерного реактора Sparc. Алгоритмы машинного обучения анализируют сотни параметров плазмы, что недоступно человеку, и помогают стабилизировать процесс.

Риски и ограничения развития

Несмотря на прогресс, отрасль сталкивается с серьезными вызовами. Исследователи из Стэнфорда и Йельского университетов обнаружили, что коммерческие модели, включая Gemini 2.5 Pro, способны запоминать и воспроизводить защищенный контент. Это ставит под вопрос юридическую защиту принципа «справедливого использования». Генеральный директор DeepMind Демис Хасабис предупредил о риске пузыря на рынке ИИ-стартапов, где высокие оценки не подкреплены реальными коммерческими активами.

Вопросы достижения общего искусственного интеллекта (AGI) остаются предметом дискуссий. Дженсен Хуанг утверждает, что AGI уже наступил, указывая на появление автономных агентов. В то же время Google DeepMind прогнозирует достижение этого уровня к 2030 году, демонстрируя более сдержанный подход. Разрыв в вычислительных мощностях между США и Китаем сохраняется, что ограничивает возможности китайских разработчиков. Блокировка западных платформ в Китае стимулировала рост локальных решений, таких как DeepSeek и Qwen, но технологическое отставание в доступе к ресурсам остается фактором.

На фоне этого: Нестабильность результатов, как в случае с моделью Veo 3, которая успешно решает задачи, но допускает ошибки в логике, указывает на то, что ИИ еще не достиг уровня надежного универсального помощника. Эти сбои рассматриваются как признак потенциала, но они ограничивают применение в критически важных сферах.

Для российского рынка эти процессы означают изменение глобальных цепочек поставок технологий и доступности вычислительных ресурсов. Ускорение перехода к локальным решениям и открытым лицензиям, как в случае с DiffusionGemma, может стать сигналом для отечественных разработчиков. Возможность запускать мощные модели на собственном оборудовании снижает зависимость от зарубежных облачных сервисов. Однако риск утечки данных и юридические коллизии с авторским правом требуют внимательного мониторинга при внедрении подобных решений.

🤖 Сводка сформирована нейросетью на основе фактов из Календаря. Мы обновляем аналитический дайджест при необходимости — факты и хронология всегда доступны в Календаре ниже для проверки и изучения.
📅 Последнее обновление сводки: 23 июня 2026.

Ключевые сюжеты

Переход от последовательной генерации к параллельной обработке меняет экономику запуска ИИ. Скорость генерации на локальном оборудовании выросла в четыре раза, что снижает зависимость от дорогих облачных мощностей. Однако риск потери всего блока текста при ошибке одного токена пока ограничивает применение технологии в критических облачных сервисах.

Запуск модели DiffusionGemma

Google DeepMind представила модель, генерирующую текст параллельными блоками вместо посимвольного набора. Архитектура Mixture of Experts позволяет работать в 18 ГБ памяти, активируя лишь часть параметров. Модель доступна под лицензией Apache 2.0.

📅 2026-06-11

Google DeepMind

DeepMind ускорил генерацию в 4 раза и перенес ИИ на локальное железо

Архитектурный сдвиг: от последовательности к параллелизму

Инфраструктурная гонка и кадровый обмен

От кода к физическому миру

Риски и ограничения развития

Ключевые сюжеты

Запуск модели DiffusionGemma

Рост скорости на локальном «железе»

Риск бессмысленности блока при ошибке

Партнерство DeepMind и Boston Dynamics

Доступность для среднего бизнеса

Эра симбиоза кода и железа

Инвестиции Google в ИИ-инфраструктуру

Усиление доминирования крупных игроков

Разрыв в доступе к мощностям

Исследование имитации личности

Влияние на эмоциональное состояние

Возвращение ключевых специалистов

Формирование кадрового ядра для конкурентов

Рост затрат на персонал

Запуск агента CodeMender

Исправление уязвимостей в крупных проектах

Двойная роль DeepMind: инноватор и поставщик кадров

Сдвиг от облаков к локальным мощностям и физическому миру

Календарь упоминаний:

Google DeepMind представила модель DiffusionGemma с параллельной генерацией текста

Формирование кадрового ядра для суверенного ИИ

Прогноз появления общего искусственного интеллекта к 2030 году

Ускорение разработки робота Atlas за счет ИИ-моделей

Расширение доступа к физическому искусственному интеллекту через ресурсы DeepMind

Обратить внимание: