Эффективность функционирования моделей
Эффективность функционирования моделей в новостной повестке, календарь упоминаний и aналитика в реальном времени.
Календарь упоминаний:
Повышение эффективности ИИ-модели Opus 4.5 в тестах по программированию
Модель Opus 4.5 демонстрирует улучшенную производительность, достигая 80.9% точности в бенчмарке SWE-Bench Verified, что выше, чем у GPT-5.1-Codex-Max и Gemini 3 Pro. При этом модель использует на 76% меньше токенов при среднем уровне усилий и на 48% меньше — при максимальном, сохраняя при этом высокий уровень результатов. Эффективное управление токенами позволяет снизить затраты и повысить производительность при решении задач программирования.
Снижение логического мышления из-за «мусорных» данных в обучении LLM
Исследование показало, что использование в обучении больших языковых моделей (LLM) данных с высокой вовлеченностью, но низкой информативностью (например, коротких сенсационных публикаций) приводит к снижению их способности к логическому мышлению и работе с контекстом. В эксперименте с четырьмя моделями, обученными на разных соотношениях таких данных, ухудшились результаты в тестах ARC AI2 Reasoning Challenge и RULER. При этом в отдельных случаях (например, 50/50 для Llama 8B) смешанные данные улучшали показатели по этическим нормам, но общая рекомендация заключается в строгом контроле качества обучающих наборов для предотвращения «загрязнения содержания».
Эффективность функционирования моделей имеет 2 записи событий в нашей базе. Объединили похожие карточки: Эффективность функционирования моделей; Уровень производительности моделей; Показатели эффективности моделей и другие.