Гонка за ИИ, понимающим реальный мир: Google, Meta⋆ и Nvidia ускоряют разработки
Ведущие компании в области искусственного интеллекта, включая Google DeepMind, Meta⋆, Nvidia, а также стартапы, разрабатывают так называемые модели мира, которые учатся понимать физические среды через видео и данные с роботов. Эти модели находят применение в робототехнике, автономных транспортных системах и развлечениях, однако их создание требует значительных вычислительных ресурсов и больших объёмов данных.
По данным The Financial Times, ведущие мировые компании в области искусственного интеллекта активно развивают так называемые модели мира, которые способны лучше понимать физические среды. Это направление рассматривается как ключевой этап на пути к достижению машинной «сверхинтеллектуальности». В этом процессе задействованы такие игроки, как Google DeepMind, Meta⋆, Nvidia, а также стартапы, включая World Labs и Runway.
В отличие от традиционных языковых моделей, новые подходы основаны на обучении с использованием видео и данных, полученных с роботов. Это позволяет системам не только обрабатывать текст, но и «понимать» окружающий мир. Такие модели могут применяться в робототехнике, автономных транспортных системах и даже в разработке ИИ-агентов.
Рост интереса к альтернативе LLM
В последние месяцы стало очевидным, что прогресс в развитии крупных языковых моделей (LLM), таких как ChatGPT, замедляется. Рост производительности между обновлениями, выпущенными OpenAI, Google и xAI Элона Маска, не соответствует масштабам инвестиций. Это стимулирует компании искать новые пути.
Так, Google DeepMind недавно представила Genie 3 — модель, которая генерирует видео кадр за кадром, учитывая предыдущие взаимодействия. Это отличается от традиционных подходов, где видео генерировалось целиком. «ИИ до сих пор ограничен цифровой средой, — отметил один из разработчиков. — Создавая виртуальные среды, близкие к реальным, мы можем обучать ИИ более масштабно, не рискуя последствиями ошибок в реальности».
Потенциал рынка и вызовы
По оценке Рев Лебаредиана, вице-президента Nvidia по технологиям Omniverse, потенциал рынка моделей мира может составить около 100 триллионов долларов. Это связано с их способностью работать в физических областях, таких как производство и здравоохранение.
Однако создание таких моделей требует огромного объема данных и вычислительных ресурсов. Они пока остаются технической задачей, не имеющей однозначного решения. В этом контексте Niantic, известная разработчиком игры Pokémon Go, уже собрала данные о 10 миллионах локаций. Эти данные собираются анонимно, но играют роль в формировании модели мира.
Применение в развлечениях и робототехнике
Одним из ближайших применений моделей мира станет развлекательная индустрия. Например, World Labs, стартап, основанный пионером ИИ Фей-Фей Ли, разрабатывает модель, которая создает 3D-среды на основе одного изображения. Это может быть использовано в видеоиграх и виртуальных мирах.
Компания Runway, сотрудничающая с голливудскими студиями, включая Lionsgate, запустила продукт, который применяет модели мира для генерации игровых сцен с персонажами и сюжетами в реальном времени. «Традиционные методы генерации видео — это грубый подход, — говорит исполнительный директор Runway. — Модели мира позволяют лучше понимать происходящее в сцене».
Стратегии Meta⋆ и Nvidia
Meta⋆ также активно развивает модели, обучаемые на видео. В июне компания представила вторую версию модели V-JEPA, которую уже тестирует на роботах. Главный исследователь ИИ Ян Лекун, один из лидеров в области ИИ, подчеркивает, что LLM не способны достичь уровня человеческого мышления и планирования. Поэтому Meta⋆ инвестирует в привлечение топ-специалистов, включая Александра Ванга, основателя компании Scale AI.
Nvidia, в свою очередь, делает ставку на физический ИИ. Компания разрабатывает платформу Omniverse, которая моделирует реальные среды. Это поддерживает ее стремление к робототехнике. Глава Nvidia Дженсен Хуан считает, что следующий этап роста компании связан именно с физическим ИИ.

Развитие моделей мира открывает возможности для широкого круга отраслей. По мнению экспертов, это может привести к революции в робототехнике, автономных системах и даже в создании ИИ-агентов. Однако реализация таких проектов требует значительных ресурсов и времени. Ян Лекун оценивает, что создание полноценной системы с человеческим уровнем интеллекта может занять около десяти лет.
Как ИИ учится видеть мир: трансформация искусственного интеллекта и её последствия
Революция в понимании физического мира
Современные модели искусственного интеллекта переживают качественный скачок — от текстового восприятия реальности к её визуальному и пространственному осмыслению. Это не только улучшение алгоритмов, а переход к новой парадигме, где ИИ может не только генерировать текст, но и видеть, планировать и действовать в физических системах. В основе этого — модели мира, обучаемые на видео, робототехнике и 3D-данных.
Ключевая особенность таких систем — их способность «думать» в контексте пространства, времени и физических законов. Это открывает путь к созданию ИИ-агентов, которые могут взаимодействовать с окружающей средой не хуже человека, а в будущем — и лучше.
Важный нюанс: Вместо того чтобы только «говорить», ИИ начинает «действовать» — и это меняет его роль в экономике, науке и повседневной жизни.
Кто в гонке и зачем
В этой гонке нет случайных участников. Google DeepMind, Meta⋆, Nvidia и стартапы вроде World Labs и Runway — это не только игроки, а стратегические силы, которые формируют будущее ИИ. Их мотивация — не только технологическая, но и экономическая. Рынок моделей мира оценивается в сотни триллионов долларов, что делает эту гонку не только научной, но и крайне конкурентной.
Nvidia, например, делает ставку на физический ИИ через платформу Omniverse. Это логично для компании, которая уже давно участвует в разработке графических решений для робототехники и виртуальных миров. Google DeepMind, как всегда, работает в тени, но её модель Genie 3 уже демонстрирует, как ИИ может строить видео кадр за кадром, как человек — мысль за мыслью. Недавно DeepMind представила две новые модели ИИ, Gemini и Titan, которые позволяют роботам сортировать грузы, распознавать голоса и принимать решения в реальном времени.
Meta⋆, в свою очередь, активно развивает среды для обучения ИИ-агентов в виртуальных мирах. Однако в августе 2025 года компания начала сокращать штат, что может замедлить её прогресс.
Важный нюанс: Nvidia вливает $100 млрд в будущее искусственного интеллекта, создавая инфраструктуру мощностью 10 гигаватт. Это вдвое превышает годовой объем поставок NVIDIA в 2024 году. Цель — приблизиться к разработке суперинтеллекта.
Инфраструктура как основа роста
Развитие ИИ требует масштабных инвестиций в инфраструктуру. Nvidia инвестирует 2,6 млрд долларов в британскую экосистему искусственного интеллекта, включая финансирование стартапа Wayve, разрабатывающего автономное вождение. Компания также активно сотрудничает с Intel, приобретя 5-процентную долю в Intel за 5 млрд долларов. Совместно они разрабатывают системы на кристалле, объединяющие x86-ядра Intel и графические чиплеты RTX Nvidia.
Важный нюанс: Совместные SoC Intel/Nvidia обеспечивают пропускную способность до 900 ГБ/с, что делает их премиальными решениями для ноутбуков, ПК и систем ИИ. Это ставит под угрозу позиции AMD и Qualcomm.
Alibaba объединяется с Nvidia в борьбе за глобальный ИИ, планируя строить новые дата-центры в Бразилии, Франции, Нидерландах и других странах. OpenAI, в свою очередь, запускает проект Stargate с участием Oracle и SoftBank, строя пять центров обработки данных в США с мощностью 7 ГВт. Nvidia выступает ключевым инвестором в этом проекте, вкладывая $100 млрд.
Перспективы для России и Европы
Для России и Европы рост ИИ-инфраструктуры за рубежом — это как вызов, так и возможность. Увеличение зависимости от иностранных чипов и решений создаёт риски, но при этом дает время на развитие собственных технологий. В Европе, например, Wayve демонстрирует, как можно интегрировать ИИ в автономное вождение. В России пока отсутствуют крупные игроки в этой сфере, но рост инвестиций в ИИ-стартапы может изменить ситуацию.
Заключение
Искусственный интеллект переживает этап, когда он выходит за рамки текстовых моделей и начинает взаимодействовать с физическим миром. Это требует не только новых алгоритмов, но и мощной инфраструктуры, а также стратегического подхода к разработке. Nvidia, Intel, Google и Alibaba уже ведут гонку, и их решения будут определять, как ИИ будет развиваться в ближайшие годы. Для России и Европы важно не только наблюдать, но и участвовать в этом процессе.