SLR-Bench


SLR-Bench в новостной повестке, календарь упоминаний и aналитика в реальном времени.

Календарь упоминаний:

2026
30 июня

SLR-Bench: рост точности модели OlmoLogic с 15% до 45% за счет логических задач

Исследование: На бенчмарке SLR-Bench модель OlmoLogic 7b Think показала точность 45.1%, что в три раза выше базовых показателей в 15.1%.

Фактор: В набор данных для обучения модели было включено 8.4% логических упражнений, взятых непосредственно из набора SLR-Bench.

Эффект: Использование задач из SLR-Bench позволило достичь значительного прироста логических способностей без изменения архитектуры нейросети.

Риск: Оптимизация модели под строгие логические задачи, включая SLR-Bench, привела к снижению качества ответов в задачах открытого диалога на 7.6 пункта.

Подробнее →


SLR-Bench имеет 1 запись событий в нашей базе.