Terminal-Bench 2.0
Terminal-Bench 2.0 в новостной повестке, календарь упоминаний и aналитика в реальном времени.
Календарь упоминаний:
2026
29 апреля
GPT-5.5 набрала 82,7% в бенчмарке Terminal-Bench 2.0, превзойдя конкурентов
Исследование: В тесте Terminal-Bench 2.0, оценивающем навыки работы с командной строкой и координацию инструментов, модель GPT-5.5 показала результат 82,7%. Этот показатель превышает результаты предшественника GPT-5.4 (75,1%) и модели Claude Opus 4.7 (69,4%).
Эффект: Высокие результаты в Terminal-Bench 2.0 считаются перспективными для автоматизации процессов DevOps и создания эффективных терминальных агентов.
Фактор: Успех модели в тестировании связан с ее способностью выполнять сложные сценарии без необходимости многократных уточняющих запросов и ручной коррекции.
Terminal-Bench 2.0 имеет 1 запись событий в нашей базе.