HealthBench
HealthBench в новостной повестке, календарь упоминаний и aналитика в реальном времени.
Календарь упоминаний:
2026
14 мая
OpenAI тестирует модели на бенчмарке HealthBench с участием врачей
Исследование: OpenAI проводит тестирование своих моделей на базе собственного бенчмарка HealthBench, разработанного совместно с более чем 260 врачами.
Эффект: Некоторые исследования показывают, что в отдельных сценариях ИИ может превосходить врачей в диагностике или снижать количество ошибок.
Риск: Критики указывают на недостаточную прозрачность тестов, проводимых на базе HealthBench, что вызывает вопросы о достоверности результатов.
HealthBench имеет 1 запись событий в нашей базе.