SmolLM2-1.7B


SmolLM2-1.7B в новостной повестке, календарь упоминаний и aналитика в реальном времени.

Календарь упоминаний:

2026
30 июня

Тесты KV Caching на SmolLM2-1.7B показали ускорение генерации в 5,21 раза

Исследование: Бенчмарк модели SmolLM2-1.7B на видеокарте NVIDIA T4 при генерации 300 токенов сравнил работу с включенным и выключенным кэшированием.

Эффект: Применение технологии KV Caching сократило время вывода модели SmolLM2-1.7B с 1 минуты 1 секунды до 11,7 секунды.

Фактор: Увеличение скорости достигается за счет сохранения промежуточных вычислений ключей и значений, что исключает повторный перебор контекста.

Риск: Внедрение кэширования повышает потребление видеопамяти, что может потребовать оптимизации при работе с очень длинными контекстами.

Подробнее →


SmolLM2-1.7B имеет 1 запись событий в нашей базе.