Эффективность функционирования моделей


Эффективность функционирования моделей в новостной повестке, календарь упоминаний и aналитика в реальном времени.

Календарь упоминаний:

2025
25 ноября

Повышение эффективности ИИ-модели Opus 4.5 в тестах по программированию

Модель Opus 4.5 демонстрирует улучшенную производительность, достигая 80.9% точности в бенчмарке SWE-Bench Verified, что выше, чем у GPT-5.1-Codex-Max и Gemini 3 Pro. При этом модель использует на 76% меньше токенов при среднем уровне усилий и на 48% меньше — при максимальном, сохраняя при этом высокий уровень результатов. Эффективное управление токенами позволяет снизить затраты и повысить производительность при решении задач программирования.

Подробнее →

24 октября

Снижение логического мышления из-за «мусорных» данных в обучении LLM

Исследование показало, что использование в обучении больших языковых моделей (LLM) данных с высокой вовлеченностью, но низкой информативностью (например, коротких сенсационных публикаций) приводит к снижению их способности к логическому мышлению и работе с контекстом. В эксперименте с четырьмя моделями, обученными на разных соотношениях таких данных, ухудшились результаты в тестах ARC AI2 Reasoning Challenge и RULER. При этом в отдельных случаях (например, 50/50 для Llama 8B) смешанные данные улучшали показатели по этическим нормам, но общая рекомендация заключается в строгом контроле качества обучающих наборов для предотвращения «загрязнения содержания».

Подробнее →


Эффективность функционирования моделей имеет 2 записи событий в нашей базе.
Объединили похожие карточки: Эффективность функционирования моделей; Уровень производительности моделей; Показатели эффективности моделей и другие.

Обратить внимание: