GPQA Diamond


GPQA Diamond в новостной повестке, упоминания и aналитика в реальном времени.

Календарь упоминаний:

2026
27 января

Qwen3-Max-Thinking достигает 90.3 балла в тесте GPQA Diamond

В тесте GPQA Diamond модель Qwen3-Max-Thinking набрала 90.3 балла, что подтверждает её способность решать сложные задачи на уровне международных стандартов. Этот результат демонстрирует высокую точность и глубину знаний модели в научных и технических областях. Применение технологии Test-Time Scaling позволило дополнительно повысить показатель до 92.8. GPQA Diamond оценивает способность ИИ-моделей к логическим рассуждениям и использованию внешних данных, что делает этот тест ключевым для оценки технической зрелости модели. Подробнее →


GPQA Diamond имеет 1запись событий в нашей базе.
Объединили похожие карточки: GPQA Diamond; GPQAdiamond и другие.