SLR-Bench
SLR-Bench в новостной повестке, календарь упоминаний и aналитика в реальном времени.
Календарь упоминаний:
2026
30 июня
SLR-Bench: рост точности модели OlmoLogic с 15% до 45% за счет логических задач
Исследование: На бенчмарке SLR-Bench модель OlmoLogic 7b Think показала точность 45.1%, что в три раза выше базовых показателей в 15.1%.
Фактор: В набор данных для обучения модели было включено 8.4% логических упражнений, взятых непосредственно из набора SLR-Bench.
Эффект: Использование задач из SLR-Bench позволило достичь значительного прироста логических способностей без изменения архитектуры нейросети.
Риск: Оптимизация модели под строгие логические задачи, включая SLR-Bench, привела к снижению качества ответов в задачах открытого диалога на 7.6 пункта.
SLR-Bench имеет 1 запись событий в нашей базе.