Test-Time Scaling


Test-Time Scaling в новостной повестке, календарь упоминаний и aналитика в реальном времени.

Календарь упоминаний:

2026
27 января

Улучшенная эффективность вывода за счёт Test-Time Scaling

Test-Time Scaling — это технология, позволяющая модели использовать дополнительные вычислительные ресурсы в процессе рассуждений, фокусируясь на повторной оценке и синтезе информации из предыдущих этапов. В отличие от традиционного увеличения параллельных потоков, она избегает повторных вычислений и концентрируется на неизвестных аспектах задачи. Применение этой стратегии в тестах повысило результаты модели Qwen3-Max-Thinking в таких направлениях, как GPQA, HLE, LiveCodeBench и IMO-AnswerBench. Например, в IMO-AnswerBench показатель вырос с 89.5 до 91.5, а в HLE(w/ tools) — с 55.8 до 58.3.

Подробнее →


Test-Time Scaling имеет 1 запись событий в нашей базе.