Test-Time Scaling
Test-Time Scaling в новостной повестке, календарь упоминаний и aналитика в реальном времени.
Календарь упоминаний:
2026
27 января
Улучшенная эффективность вывода за счёт Test-Time Scaling
Test-Time Scaling — это технология, позволяющая модели использовать дополнительные вычислительные ресурсы в процессе рассуждений, фокусируясь на повторной оценке и синтезе информации из предыдущих этапов. В отличие от традиционного увеличения параллельных потоков, она избегает повторных вычислений и концентрируется на неизвестных аспектах задачи. Применение этой стратегии в тестах повысило результаты модели Qwen3-Max-Thinking в таких направлениях, как GPQA, HLE, LiveCodeBench и IMO-AnswerBench. Например, в IMO-AnswerBench показатель вырос с 89.5 до 91.5, а в HLE(w/ tools) — с 55.8 до 58.3.
Test-Time Scaling имеет 1 запись событий в нашей базе.