Сентябрь 2025   |   Обзор события   | 7

Гонка за ИИ, понимающим реальный мир: Google, Meta⋆ и Nvidia ускоряют разработки

Ведущие компании в области искусственного интеллекта, включая Google DeepMind, Meta⋆, Nvidia, а также стартапы, разрабатывают так называемые модели мира, которые учатся понимать физические среды через видео и данные с роботов. Эти модели находят применение в робототехнике, автономных транспортных системах и развлечениях, однако их создание требует значительных вычислительных ресурсов и больших объёмов данных.

ИСХОДНЫЙ НАРРАТИВ

По данным The Financial Times, ведущие мировые компании в области искусственного интеллекта активно развивают так называемые модели мира, которые способны лучше понимать физические среды. Это направление рассматривается как ключевой этап на пути к достижению машинной «сверхинтеллектуальности». В этом процессе задействованы такие игроки, как Google DeepMind, Meta⋆, Nvidia, а также стартапы, включая World Labs и Runway.

В отличие от традиционных языковых моделей, новые подходы основаны на обучении с использованием видео и данных, полученных с роботов. Это позволяет системам не только обрабатывать текст, но и «понимать» окружающий мир. Такие модели могут применяться в робототехнике, автономных транспортных системах и даже в разработке ИИ-агентов.

Рост интереса к альтернативе LLM

В последние месяцы стало очевидным, что прогресс в развитии крупных языковых моделей (LLM), таких как ChatGPT, замедляется. Рост производительности между обновлениями, выпущенными OpenAI, Google и xAI Элона Маска, не соответствует масштабам инвестиций. Это стимулирует компании искать новые пути.

Так, Google DeepMind недавно представила Genie 3 — модель, которая генерирует видео кадр за кадром, учитывая предыдущие взаимодействия. Это отличается от традиционных подходов, где видео генерировалось целиком. «ИИ до сих пор ограничен цифровой средой, — отметил один из разработчиков. — Создавая виртуальные среды, близкие к реальным, мы можем обучать ИИ более масштабно, не рискуя последствиями ошибок в реальности».

Потенциал рынка и вызовы

По оценке Рев Лебаредиана, вице-президента Nvidia по технологиям Omniverse, потенциал рынка моделей мира может составить около 100 триллионов долларов. Это связано с их способностью работать в физических областях, таких как производство и здравоохранение.

Однако создание таких моделей требует огромного объема данных и вычислительных ресурсов. Они пока остаются технической задачей, не имеющей однозначного решения. В этом контексте Niantic, известная разработчиком игры Pokémon Go, уже собрала данные о 10 миллионах локаций. Эти данные собираются анонимно, но играют роль в формировании модели мира.

Применение в развлечениях и робототехнике

Одним из ближайших применений моделей мира станет развлекательная индустрия. Например, World Labs, стартап, основанный пионером ИИ Фей-Фей Ли, разрабатывает модель, которая создает 3D-среды на основе одного изображения. Это может быть использовано в видеоиграх и виртуальных мирах.

Компания Runway, сотрудничающая с голливудскими студиями, включая Lionsgate, запустила продукт, который применяет модели мира для генерации игровых сцен с персонажами и сюжетами в реальном времени. «Традиционные методы генерации видео — это грубый подход, — говорит исполнительный директор Runway. — Модели мира позволяют лучше понимать происходящее в сцене».

Стратегии Meta⋆ и Nvidia

Meta⋆ также активно развивает модели, обучаемые на видео. В июне компания представила вторую версию модели V-JEPA, которую уже тестирует на роботах. Главный исследователь ИИ Ян Лекун, один из лидеров в области ИИ, подчеркивает, что LLM не способны достичь уровня человеческого мышления и планирования. Поэтому Meta⋆ инвестирует в привлечение топ-специалистов, включая Александра Ванга, основателя компании Scale AI.

Nvidia, в свою очередь, делает ставку на физический ИИ. Компания разрабатывает платформу Omniverse, которая моделирует реальные среды. Это поддерживает ее стремление к робототехнике. Глава Nvidia Дженсен Хуан считает, что следующий этап роста компании связан именно с физическим ИИ.

Концептуальное изображение
Создано специально для ASECTOR
Концептуальное изображение

Развитие моделей мира открывает возможности для широкого круга отраслей. По мнению экспертов, это может привести к революции в робототехнике, автономных системах и даже в создании ИИ-агентов. Однако реализация таких проектов требует значительных ресурсов и времени. Ян Лекун оценивает, что создание полноценной системы с человеческим уровнем интеллекта может занять около десяти лет.

АНАЛИТИЧЕСКИЙ РАЗБОР

Как ИИ учится видеть мир: трансформация искусственного интеллекта и её последствия

Революция в понимании физического мира

Современные модели искусственного интеллекта переживают качественный скачок — от текстового восприятия реальности к её визуальному и пространственному осмыслению. Это не только улучшение алгоритмов, а переход к новой парадигме, где ИИ может не только генерировать текст, но и видеть, планировать и действовать в физических системах. В основе этого — модели мира, обучаемые на видео, робототехнике и 3D-данных.

Ключевая особенность таких систем — их способность «думать» в контексте пространства, времени и физических законов. Это открывает путь к созданию ИИ-агентов, которые могут взаимодействовать с окружающей средой не хуже человека, а в будущем — и лучше.

Важный нюанс: Вместо того чтобы только «говорить», ИИ начинает «действовать» — и это меняет его роль в экономике, науке и повседневной жизни.

Кто в гонке и зачем

В этой гонке нет случайных участников. Google DeepMind, Meta⋆, Nvidia и стартапы вроде World Labs и Runway — это не только игроки, а стратегические силы, которые формируют будущее ИИ. Их мотивация — не только технологическая, но и экономическая. Рынок моделей мира оценивается в сотни триллионов долларов, что делает эту гонку не только научной, но и крайне конкурентной.

Nvidia, например, делает ставку на физический ИИ через платформу Omniverse. Это логично для компании, которая уже давно участвует в разработке графических решений для робототехники и виртуальных миров. Google DeepMind, как всегда, работает в тени, но её модель Genie 3 уже демонстрирует, как ИИ может строить видео кадр за кадром, как человек — мысль за мыслью. Недавно DeepMind представила две новые модели ИИ, Gemini и Titan, которые позволяют роботам сортировать грузы, распознавать голоса и принимать решения в реальном времени.

Meta⋆, в свою очередь, активно развивает среды для обучения ИИ-агентов в виртуальных мирах. Однако в августе 2025 года компания начала сокращать штат, что может замедлить её прогресс.

Важный нюанс: Nvidia вливает $100 млрд в будущее искусственного интеллекта, создавая инфраструктуру мощностью 10 гигаватт. Это вдвое превышает годовой объем поставок NVIDIA в 2024 году. Цель — приблизиться к разработке суперинтеллекта.

Инфраструктура как основа роста

Развитие ИИ требует масштабных инвестиций в инфраструктуру. Nvidia инвестирует 2,6 млрд долларов в британскую экосистему искусственного интеллекта, включая финансирование стартапа Wayve, разрабатывающего автономное вождение. Компания также активно сотрудничает с Intel, приобретя 5-процентную долю в Intel за 5 млрд долларов. Совместно они разрабатывают системы на кристалле, объединяющие x86-ядра Intel и графические чиплеты RTX Nvidia.

Важный нюанс: Совместные SoC Intel/Nvidia обеспечивают пропускную способность до 900 ГБ/с, что делает их премиальными решениями для ноутбуков, ПК и систем ИИ. Это ставит под угрозу позиции AMD и Qualcomm.

Alibaba объединяется с Nvidia в борьбе за глобальный ИИ, планируя строить новые дата-центры в Бразилии, Франции, Нидерландах и других странах. OpenAI, в свою очередь, запускает проект Stargate с участием Oracle и SoftBank, строя пять центров обработки данных в США с мощностью 7 ГВт. Nvidia выступает ключевым инвестором в этом проекте, вкладывая $100 млрд.

Перспективы для России и Европы

Для России и Европы рост ИИ-инфраструктуры за рубежом — это как вызов, так и возможность. Увеличение зависимости от иностранных чипов и решений создаёт риски, но при этом дает время на развитие собственных технологий. В Европе, например, Wayve демонстрирует, как можно интегрировать ИИ в автономное вождение. В России пока отсутствуют крупные игроки в этой сфере, но рост инвестиций в ИИ-стартапы может изменить ситуацию.

Заключение

Искусственный интеллект переживает этап, когда он выходит за рамки текстовых моделей и начинает взаимодействовать с физическим миром. Это требует не только новых алгоритмов, но и мощной инфраструктуры, а также стратегического подхода к разработке. Nvidia, Intel, Google и Alibaba уже ведут гонку, и их решения будут определять, как ИИ будет развиваться в ближайшие годы. Для России и Европы важно не только наблюдать, но и участвовать в этом процессе.

Коротко о главном

Google DeepMind представила модель Genie 3, генерирующую видео кадр за кадром

Это отличается от традиционного подхода, где видео создавалось целиком, и позволяет учитывать предыдущие взаимодействия в процессе генерации.

Niantic собрала данные о 10 миллионах локаций для формирования модели мира

Эти данные собираются анонимно и используются для обучения ИИ в виртуальных средах, близких к реальным.

Meta⋆ запустила вторую версию модели V-JEPA и тестирует её на роботах

Компания инвестирует в привлечение топ-специалистов, включая Александра Ванга, и делает ставку на обучение ИИ по видео.

Runway применяет модели мира для создания игровых сцен в реальном времени

Сотрудничество с Lionsgate и другими голливудскими студиями позволяет использовать ИИ для генерации сюжетов и персонажей.

World Labs разрабатывает 3D-среды на основе одного изображения

Это может быть использовано в разработке видеоигр и виртуальных миров, где требуется быстрая генерация контента.

Ян Лекун оценивает создание полноценного человеческого ИИ в 10 лет

Он подчеркивает, что языковые модели не способны достичь уровня человеческого мышления и планирования, поэтому необходимы новые подходы.

Инфографика событий

Открыть инфографику на весь экран


Участники и связи

Отрасли: ИТ и программное обеспечение; Искусственный интеллект (AI); Кибербезопасность; Бизнес; Цифровизация и технологии; Развлечение и творчество; Видеоигры; Передовые технологии; Робототехника

Оценка значимости: 7 из 10

Развитие моделей искусственного интеллекта, способных понимать физический мир, затрагивает ключевые сферы — технологии, экономику, робототехнику и развлечения, что указывает на широту влияния. Хотя событие глобальное, оно может косвенно затронуть Россию через отставание в технологиях и угрозу зависимости от иностранных решений. Продолжительность процесса оценивается как среднесрочная, а масштаб — национально-важный для стран, задействованных в ИИ-гонке.

Материалы по теме

⋆ Данная организация или продукт включены в список экстремистских в соответствии с решением суда, вступившим в законную силу. Деятельность запрещена на территории Российской Федерации на основании Федерального закона от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности».