Анализ моделей искусственного интеллекта


Анализ моделей искусственного интеллекта в новостной повестке, календарь упоминаний и aналитика в реальном времени.

Календарь упоминаний:

2025
08 ноября

Сомнительная научная обоснованность тестов ИИ

Большинство бенчмарков для оценки ИИ-моделей не соответствуют строгим научным стандартам, что вызывает сомнения в объективности их результатов. В исследовании OII было проанализировано 445 тестов, и лишь 16% оказались корректными. Многие из них пытаются измерить абстрактные понятия без чётких определений, а 27% используют неслучайные выборки, что снижает их репрезентативность. Без научного подхода к оценке остаются спорными заявки компаний, таких как OpenAI, на превосходство своих моделей.

Подробнее →

20 октября

Потенциал Grok 5: необходимость объективного тестирования

Для объективной оценки способностей модели Grok 5 в программировании требуется проведение соревнований по строгим критериям, включая фиксированную продолжительность, публичный набор задач, равный доступ к ресурсам и независимую оценку. На данный момент модель xAI не представлена в результатах ICPC-уровня, в отличие от Gemini 2.5 (10/12) и GPT-4/GPT-5 (12/12), что делает невозможным её сравнение с этими моделями. Официальный запуск Grok 5 на задачах чемпионата мира позволит определить её позицию среди ведущих ИИ-моделей.

Подробнее →


Анализ моделей искусственного интеллекта имеет 2 записи событий в нашей базе.
Объединили похожие карточки: Анализ моделей искусственного интеллекта; Наблюдение за моделями искусственного интеллекта; Тестирование моделей искусственного интеллекта и другие.

Обратить внимание: