HealthBench


HealthBench в новостной повестке, календарь упоминаний и aналитика в реальном времени.

Календарь упоминаний:

2026
14 мая

OpenAI тестирует модели на бенчмарке HealthBench с участием врачей

Исследование: OpenAI проводит тестирование своих моделей на базе собственного бенчмарка HealthBench, разработанного совместно с более чем 260 врачами.

Эффект: Некоторые исследования показывают, что в отдельных сценариях ИИ может превосходить врачей в диагностике или снижать количество ошибок.

Риск: Критики указывают на недостаточную прозрачность тестов, проводимых на базе HealthBench, что вызывает вопросы о достоверности результатов.

Подробнее →


HealthBench имеет 1 запись событий в нашей базе.