GPQA Diamond
GPQA Diamond в новостной повестке, упоминания и aналитика в реальном времени.
Календарь упоминаний:
2026
27 января
Qwen3-Max-Thinking достигает 90.3 балла в тесте GPQA Diamond
В тесте GPQA Diamond модель Qwen3-Max-Thinking набрала 90.3 балла, что подтверждает её способность решать сложные задачи на уровне международных стандартов. Этот результат демонстрирует высокую точность и глубину знаний модели в научных и технических областях. Применение технологии Test-Time Scaling позволило дополнительно повысить показатель до 92.8. GPQA Diamond оценивает способность ИИ-моделей к логическим рассуждениям и использованию внешних данных, что делает этот тест ключевым для оценки технической зрелости модели.
GPQA Diamond имеет 1запись событий в нашей базе. Объединили похожие карточки: GPQA Diamond; GPQAdiamond и другие.