23 июня 2026   |   Живая аналитика

DeepMind ускорил генерацию в 4 раза и перенес ИИ на локальное железо

Новая архитектура DiffusionGemma ускорит генерацию текста на локальных видеокартах в четыре раза, перекладывая нагрузку с памяти на вычислительную мощность.

Google DeepMind — одна из самых известных и влиятельных компаний в мире искусственного интеллекта. Основанная в 2010 году в Лондоне как DeepMind Technologies, компания стала символом прорыва в разработке ИИ-систем, способных решать сложные задачи, от игр до биологических исследований. В 2014 году она была приобретена Google за сумму, оцениваемую от $400 до $650 миллионов, что стало одним из ключевых событий в истории развития технологий искусственного интеллекта.

Архитектурный сдвиг: от последовательности к параллелизму

Google DeepMind представила модель DiffusionGemma, которая меняет подход к генерации текста. Вместо привычного посимвольного набора, где каждый новый символ зависит от предыдущего, новая архитектура формирует текст параллельными блоками. Это решение переносит узкое место с пропускной способности памяти на вычислительную мощность процессора. На локальных видеокартах скорость генерации выросла в четыре раза. Модель уже доступна для скачивания на платформе Hugging Face под лицензией Apache 2.0 и входит в семейство Gemma 4.

Важный нюанс: Переход к блочной генерации меняет экономику владения ИИ. Бизнесу больше не обязательно арендовать дорогие облачные мощности для быстрого вывода текста; задача решается на стандартном «железе», если у него достаточно вычислительной производительности.

Техническая реализация опирается на архитектуру Mixture of Experts (смесь экспертов). Система активирует лишь 3,8 миллиарда параметров из общего пула в 26 миллиардов, что позволяет модели работать в 18 ГБ оперативной памяти. Тесты на ускорителях Nvidia H100 показали скорость до 1000 токенов в секунду. Однако технология пока не внедрена в облачные модели Gemini. Причиной служит риск потери смысла всего блока текста при ошибке в одном токене, что делает метод пока непригодным для задач, требующих абсолютной точности в каждом слове.

Инфраструктурная гонка и кадровый обмен

Развитие алгоритмов неразрывно связано с доступом к вычислительным ресурсам. Google направляет значительные инвестиции в расширение мощностей для DeepMind, стремясь удваивать их каждые полгода. В 2026 году капитальные вложения компании достигли $185 млрд. Этот рост создает высокий барьер входа для новых игроков и усиливает доминирование тех, кто контролирует как софт, так и «железо». В то же время, европейский рынок реагирует на эту динамику созданием суверенной инфраструктуры. Стартап Mistral AI, основанный бывшими исследователями DeepMind, привлек $830 млн на строительство дата-центров в Париже и Швеции. Цель — обеспечить 200 мегаватт мощности к 2027 году и снизить зависимость от американских облачных гигантов.

Кадровый обмен между лабораториями остается ключевым драйвером инноваций. Google активно возвращает бывших специалистов, включая Ноама Шахареля и Даниэля де Фрейтаса, для усиления разработки моделей Gemini. Параллельно Microsoft и другие конкуренты переманивают таланты из DeepMind, формируя собственные команды. В Великобритании расходы DeepMind на персонал в 2024 году выросли до £1,01 млрд, что отражает жесткую конкуренцию за квалифицированные кадры.

От кода к физическому миру

Фокус исследований смещается от текстовых задач к решению проблем в реальном мире. Google DeepMind интегрировала платформу Intrinsic в свою экосистему, объединив её с моделями Gemini. Это позволяет заводам перестраивать производство за считанные клики, делая адаптивных роботов доступными для среднего бизнеса. Совместно с Boston Dynamics компания ускоряет создание гуманоидного робота Atlas, предоставляя ему фундаментальные модели ИИ. Новые модели Gemini Robotics 1.5 и Gemini Robotics-ER 1.5 позволяют роботам планировать действия на несколько шагов вперед, использовать поисковые системы для получения информации и переносить навыки между разными устройствами.

Стоит учесть: Успех в робототехнике теперь зависит не от одного алгоритма, а от глубокой интеграции «мозга» и «нервной системы». Стартапы вынуждены объединяться с чипмейкерами, так как создание автономных машин силами одного игрока становится невозможным.

В сфере безопасности ИИ-агент CodeMender за полгода внес 72 подтвержденных исправления в открытые проекты, обработав более 4 млн строк кода. Система автоматически выявляет уязвимости, объединяя анализ кода и фаззинг. В энергетике DeepMind сотрудничает с Commonwealth Fusion Systems для оптимизации термоядерного реактора Sparc. Алгоритмы машинного обучения анализируют сотни параметров плазмы, что недоступно человеку, и помогают стабилизировать процесс.

Риски и ограничения развития

Несмотря на прогресс, отрасль сталкивается с серьезными вызовами. Исследователи из Стэнфорда и Йельского университетов обнаружили, что коммерческие модели, включая Gemini 2.5 Pro, способны запоминать и воспроизводить защищенный контент. Это ставит под вопрос юридическую защиту принципа «справедливого использования». Генеральный директор DeepMind Демис Хасабис предупредил о риске пузыря на рынке ИИ-стартапов, где высокие оценки не подкреплены реальными коммерческими активами.

Вопросы достижения общего искусственного интеллекта (AGI) остаются предметом дискуссий. Дженсен Хуанг утверждает, что AGI уже наступил, указывая на появление автономных агентов. В то же время Google DeepMind прогнозирует достижение этого уровня к 2030 году, демонстрируя более сдержанный подход. Разрыв в вычислительных мощностях между США и Китаем сохраняется, что ограничивает возможности китайских разработчиков. Блокировка западных платформ в Китае стимулировала рост локальных решений, таких как DeepSeek и Qwen, но технологическое отставание в доступе к ресурсам остается фактором.

На фоне этого: Нестабильность результатов, как в случае с моделью Veo 3, которая успешно решает задачи, но допускает ошибки в логике, указывает на то, что ИИ еще не достиг уровня надежного универсального помощника. Эти сбои рассматриваются как признак потенциала, но они ограничивают применение в критически важных сферах.

Для российского рынка эти процессы означают изменение глобальных цепочек поставок технологий и доступности вычислительных ресурсов. Ускорение перехода к локальным решениям и открытым лицензиям, как в случае с DiffusionGemma, может стать сигналом для отечественных разработчиков. Возможность запускать мощные модели на собственном оборудовании снижает зависимость от зарубежных облачных сервисов. Однако риск утечки данных и юридические коллизии с авторским правом требуют внимательного мониторинга при внедрении подобных решений.

🤖 Сводка сформирована нейросетью на основе фактов из Календаря. Мы обновляем аналитический дайджест при необходимости — факты и хронология всегда доступны в Календаре ниже для проверки и изучения.
📅 Последнее обновление сводки: 23 июня 2026.


Ключевые сюжеты

Переход от последовательной генерации к параллельной обработке меняет экономику запуска ИИ. Скорость генерации на локальном оборудовании выросла в четыре раза, что снижает зависимость от дорогих облачных мощностей. Однако риск потери всего блока текста при ошибке одного токена пока ограничивает применение технологии в критических облачных сервисах.

Запуск модели DiffusionGemma

Google DeepMind представила модель, генерирующую текст параллельными блоками вместо посимвольного набора. Архитектура Mixture of Experts позволяет работать в 18 ГБ памяти, активируя лишь часть параметров. Модель доступна под лицензией Apache 2.0.

📅 2026-06-11
Читать источник →

Рост скорости на локальном «железе»

Тесты показали генерацию до 1000 токенов в секунду на ускорителях Nvidia H100. Скорость работы на локальных видеокартах увеличилась в четыре раза по сравнению с аналогами. Проблема сместилась с пропускной способности памяти на вычислительную мощность.

📅 2026-06-11
Читать источник →

Риск бессмысленности блока при ошибке

Технология пока не используется в облачных моделях Gemini. Ошибка в одном токене может сделать бессмысленным весь сгенерированный блок текста, что создает риски для надежности в критических приложениях.

📅 2026-06-11
Читать источник →

Двойная роль DeepMind: инноватор и поставщик кадров

DeepMind одновременно двигает технологическую границу (DiffusionGemma, робототехника, безопасность кода) и служит «инкубатором» для конкурентов. Бывшие сотрудники создают новые мощные игроки (Mistral AI), а возвращение специалистов усиливает текущие разработки. Это создает парадокс: успех лаборатории в подготовке кадров может ослабить её собственное долгосрочное доминирование, но укрепляет экосистему в целом.

Компаниям стоит учитывать, что инвестиции в развитие собственных ИИ-лабораторий могут привести к утечке ключевых компетенций в виде стартапов. Стратегия удержания талантов должна включать не только финансовые стимулы, но и уникальные условия для реализации амбициозных проектов.

Сдвиг от облаков к локальным мощностям и физическому миру

Появление DiffusionGemma и развитие робототехники (Atlas, Intrinsic) указывают на два вектора: демократизацию мощных моделей для локального использования и интеграцию ИИ в физическую реальность. Это меняет экономику отрасли: снижается зависимость от облачных гигантов для базовых задач, но растет потребность в глубокой интеграции с «железом» для сложных сценариев.

Бизнесу следует готовиться к переходу от чисто облачных моделей к гибридным решениям. Инвестиции в локальную инфраструктуру и развитие компетенций по интеграции ИИ с физическими системами станут ключевыми факторами конкурентоспособности.

Обновлено: 23 июня 2026

Календарь упоминаний:

2026
11 июня

Google DeepMind представила модель DiffusionGemma с параллельной генерацией текста

Суть: Компания Google DeepMind анонсировала модель DiffusionGemma, которая генерирует текст блоками параллельно, отказываясь от последовательного авто регрессивного метода.

Событие: Модель была выпущена в семейство Gemma 4 и стала доступна для скачивания на платформе Hugging Face под лицензией Apache 2.0.

Исследование: Тесты показали, что DiffusionGemma генерирует до 1000 токенов в секунду на ускорителях Nvidia H100, что в четыре раза быстрее аналогов.

Фактор: Архитектура Mixture of Experts позволяет модели работать в 18 ГБ оперативной памяти, активируя лишь 3,8 миллиарда из 26 миллиардов параметров.

Риск: Технология пока не используется в облачных моделях Gemini из-за риска бессмысленности всего блока текста при ошибке в одном токене.

Подробнее →

30 марта

Формирование кадрового ядра для суверенного ИИ

Бывшие исследователи DeepMind, в частности Артур Менш, основали компанию Mistral AI, ставшую ключевым игроком в обеспечении технологического суверенитета Европы. Этот кадровый переход позволил создать стартап, который активно развивает собственную инфраструктуру и открытые языковые модели, снижая зависимость региона от американских облачных гигантов. Успех Mistral AI демонстрирует прямую связь между опытом ведущих мировых лабораторий и способностью европейских компаний выстраивать независимые экосистемы искусственного интеллекта.

Подробнее →

25 марта

Прогноз появления общего искусственного интеллекта к 2030 году

Google DeepMind ожидает достижения общего искусственного интеллекта к 2030 году, что демонстрирует более сдержанные временные горизонты по сравнению с утверждениями о его уже наступившем статусе. Эта позиция подчеркивает наличие разногласий в отрасли относительно текущих возможностей технологий и необходимости времени для завершения технологического прогресса.

Подробнее →

09 марта

Ускорение разработки робота Atlas за счет ИИ-моделей

В январе Google DeepMind заключила стратегическое партнерство с Boston Dynamics для ускорения создания гуманоидного робота Atlas. Ключевым вкладом компании стало предоставление фундаментальных моделей искусственного интеллекта, необходимых для совершенствования робототехнических решений. Это соглашение демонстрирует переход отрасли к глубокой интеграции алгоритмов ИИ с аппаратным обеспечением вместо простой покупки готовых технологий.

Подробнее →

04 марта

Расширение доступа к физическому искусственному интеллекту через ресурсы DeepMind

Переход платформы Intrinsic в структуру Google открывает доступ к ресурсам подразделения Google DeepMind, что позволяет сократить путь от научных исследований до практического применения на конвейере. Объединение с моделями Gemini и облачной инфраструктурой ускоряет внедрение адаптивных роботов в промышленность и логистику, делая автоматизацию доступной для более широкого круга предприятий. Это сотрудничество трансформирует подход к производству, обеспечивая возможность масштабирования передовых решений ИИ от лабораторных экспериментов до промышленных стандартов.

Подробнее →



Google DeepMind имеет 27 записей событий в нашей базе.
Объединили похожие карточки: Google DeepMind; DeepMind Technologies Limited; DeepMind Technologies и другие.

Обратить внимание: