Август 2025 | Обзор события | 7

GPT-5 превзошел конкурентов в тесте на пространственное мышление

Исследователи провели масштабное исследование, посвященное пространственному восприятию у современных моделей искусственного интеллекта. Модель GPT-5 показала лучшие результаты среди конкурентов в задачах, связанных с оценкой расстояний и пониманием пространственного расположения объектов. Однако в более сложных категориях, таких как мысленная сборка объектов или смена ракурсов, разрыв между GPT-5 и человеком остается значительным.

Содержание

Обзор

Единый стандарт оценки

GPT-5 лидирует, но есть куда стремиться

Роль «токенов мышления»

Чувствительность к порядку ответов

Перспективы развития

ИСХОДНЫЙ НАРРАТИВ

Исследователи из SenseTime Research и S‑Lab Наньянского технологического университета провели масштабное исследование, посвященное пространственному восприятию у современных мультимодальных моделей. В работе приняли участие восемь популярных бенчмарков, а для тестирования было использовано более миллиарда токенов.

Единый стандарт оценки

Для унификации подхода к тестированию авторы предложили универсальную схему из шести базовых пространственных умений:

метрические оценки;
мысленная реконструкция;
пространственные отношения;
смена перспективы;
деформация и сборка;
комплексное рассуждение.

Это позволило сравнивать модели на общей основе, а также стандартизировать системные промпты, шаблоны ответов и метрики.

GPT-5 лидирует, но есть куда стремиться

В ходе исследования модель GPT-5 продемонстрировала впечатляющие результаты, уверенно обойдя конкурентов, таких как Gemini‑2. 5‑Pro и линейку InternVL. GPT-5 показал результаты, сравнимые с человеческими, в задачах, связанных с оценкой расстояний и пониманием пространственного расположения объектов.

Однако в более сложных категориях, таких как мысленная сборка объектов, смена ракурсов или симуляция действий, разрыв между GPT-5 и человеком по-прежнему велик.

Интересно, что в самых трудных случаях закрытые модели вроде GPT-5 не имеют явного преимущества над открытыми конкурентами.

Роль «токенов мышления»

Исследователи также изучили влияние количества «токенов мышления», используемых моделью для размышления, на точность ответа. Оказалось, что чем больше модель тратит «токенов», тем точнее ответ — но только до определённого предела. При слишком глубоком размышлении GPT-5 часто сталкивается с таймаутами и усечёнными ответами.

Чувствительность к порядку ответов

В ходе проверки на устойчивость к эффекту позиции вариантов в тестах с выбором ответа было выявлено, что при «жёсткой» круговой переупаковке — когда правильный ответ должен быть угадан независимо от позиции — точность GPT-5 резко падает. Это указывает на остаточную чувствительность модели к расположению опций.

Перспективы развития

В целом исследование показало, что модели уже уверенно справляются с базовыми задачами, где требуется оценка размеров и расположений. Однако там, где вступает в игру полноценное трёхмерное воображение, способность перестраивать мысленный образ и проводить логические операции в пространстве — GPT-5 пока далёк от человека. Пространственный интеллект остаётся одним из самых сложных и интересных рубежей для искусственного интеллекта.

АНАЛИТИЧЕСКИЙ РАЗБОР

Тестирование пространственного мышления у современных моделей, таких как GPT-5, выявило интересные закономерности развития искусственного интеллекта. GPT-5 демонстрирует впечатляющие результаты в задачах, связанных с оценкой расстояний и пониманием пространственного расположения объектов, что говорит о значительном прогрессе в области обработки информации.

Однако, сложности возникают при решении задач, требующих более высокого уровня абстракции, таких как мысленная сборка объектов, смена ракурсов или симуляция действий. Это указывает на то, что пространственный интеллект остается одной из наиболее сложных областей для AI.

Интересно отметить, что в самых трудных случаях закрытые модели вроде GPT-5 не имеют явного преимущества над открытыми конкурентами. Это может свидетельствовать о том, что открытый доступ к исходному коду и возможность совместного развития могут быть ключевыми факторами для преодоления текущих ограничений.

Дальнейшее развитие пространственного интеллекта у AI потребует новых подходов и алгоритмов, способных обрабатывать информацию в более абстрактной и гибкой форме, приближаясь к уровню человеческого восприятия.

Источник: securitylab.ru

Контакты Асектор ✉

Коротко о главном

GPT-5 преуспел в задачах, связанных с метрическими оценками

Модель показала результаты, сравнимые с человеческими, в оценке размеров и расстояний между объектами.

GPT-5 испытывает трудности в более сложных пространственных задачах

Модель пока не может эффективно выполнять задачи, требующие мысленной сборки объектов, смены ракурсов или симуляции действий.

Точность ответов GPT-5 зависит от количества «токенов мышления»

Чем больше модель тратит на размышление, тем точнее результат, но только до определённого предела.

GPT-5 чувствителен к порядку вариантов в тестах с выбором ответа

Модель демонстрирует падение точности при изменении позиции правильного ответа.

Инфографика событий

Открыть инфографику на весь экран

Участники и связи

Отрасли: ИТ и программное обеспечение; Искусственный интеллект (AI); Бизнес; Аналитика и исследования; Стартапы и инновации; Цифровизация и технологии; Передовые технологии

Темы: Искусственный интеллект; Подражание; Пространственное мышление;

Оценка значимости: 7 из 10

Событие представляет собой значительный прорыв в области ИИ, затрагивающий сферу технологий и науки. Исследование проводилось на обширном наборе данных, что указывает на его масштаб. Результаты демонстрируют прогресс GPT-5 в пространственном мышлении, но также указывают на необходимость дальнейшего развития в этой области.