Terminal-Bench 2.0


Terminal-Bench 2.0 в новостной повестке, календарь упоминаний и aналитика в реальном времени.

Календарь упоминаний:

2026
29 апреля

GPT-5.5 набрала 82,7% в бенчмарке Terminal-Bench 2.0, превзойдя конкурентов

Исследование: В тесте Terminal-Bench 2.0, оценивающем навыки работы с командной строкой и координацию инструментов, модель GPT-5.5 показала результат 82,7%. Этот показатель превышает результаты предшественника GPT-5.4 (75,1%) и модели Claude Opus 4.7 (69,4%).

Эффект: Высокие результаты в Terminal-Bench 2.0 считаются перспективными для автоматизации процессов DevOps и создания эффективных терминальных агентов.

Фактор: Успех модели в тестировании связан с ее способностью выполнять сложные сценарии без необходимости многократных уточняющих запросов и ручной коррекции.

Подробнее →


Terminal-Bench 2.0 имеет 1 запись событий в нашей базе.