Параметры модели


Параметры модели в новостной повестке, календарь упоминаний и aналитика в реальном времени.

Календарь упоминаний:

2026
30 июня

Исследование AllenAI выявило различия в работе гибридных моделей и трансформеров на уровне токенов

Суть: Параметры модели объемом 1 млрд параметров были протестированы в исследовании от 25 июня 2026 года, показав, что гибридная архитектура Olmo Hybrid эффективнее предсказывает смысловые токены, а трансформер Olmo 3 — лучше копирует текст.

Исследование: Сравнение проводилось на моделях с идентичными данными обучения и токенизатором, где гибридная модель показала преимущество в ошибке на 0.04 при предсказании существительных и глаголов.

Фактор: Различие в производительности обусловлено использованием рекуррентных слоев в гибридах для сжатого хранения контекста, что обеспечивает постоянную стоимость вычислений, но снижает точность при копировании удаленных фраз.

Эффект: Эксперименты подтвердили, что усредненные метрики качества скрывают реальную специализацию архитектур, требуя внедрения сегментированной оценки по типам токенов.

Подробнее →


Параметры модели имеет 1 запись событий в нашей базе.