Научная подтверждённость
Научная подтверждённость в новостной повестке, календарь упоминаний и aналитика в реальном времени.
Календарь упоминаний:
2025
08 ноября
Падение достоверности бенчмарков ИИ
Большинство тестов, на которых основываются заявления компаний в области ИИ, не соответствуют строгим научным стандартам. Из 445 проанализированных бенчмарков для языковых моделей только 16% были признаны научно обоснованными. Основные проблемы — отсутствие чётких определений измеряемых понятий и использование неслучайных, удобных выборок данных, что делает тесты непредставительными. Без научной валидности такие тесты не позволяют объективно сравнивать модели, а их использование в маркетинге вызывает сомнения в достоверности претензий компаний.
Научная подтверждённость имеет 1 запись событий в нашей базе. Объединили похожие карточки: Научная подтверждённость; Научная обоснованность; Научная достоверность и другие.