S4


S4 в новостной повестке, календарь упоминаний и aналитика в реальном времени.

Календарь упоминаний:

2026
30 июня

S4 демонстрирует превосходство над трансформерами в задачах с длинными последовательностями

Суть: Архитектура S4 на основе моделей пространства состояний обрабатывает данные в трех режимах, позволяя эффективно работать с последовательностями до 16 000 токенов при меньшем количестве параметров.

Исследование: На бенчмарке Speech Commands модель S4 показала результат на 13% выше сверточных сетей, требуя в 85 раз меньше параметров для достижения аналогичного качества.

Исследование: В задаче Path-X модель S4 успешно обработала последовательность длиной 16 000 токенов, установив рекорд точности на sCIFAR-10 всего с 100 000 параметров.

Риск: На задачах с текстом, таких как WikiText-103, S4 демонстрирует более высокую перплексивность по сравнению с оптимизированными трансформерами из-за дискретной природы данных.

Фактор: Производительность S4 критически зависит от инициализации матрицы A, где использование метода HiPPO повышает точность с 60% до 98% на стандартных тестах.

Подробнее →


S4 имеет 1 запись событий в нашей базе.