HuggingFace Transformers v5


HuggingFace Transformers v5 в новостной повестке, календарь упоминаний и aналитика в реальном времени.

Календарь упоминаний:

2026
30 июня

Интеграция NeMo AutoModel с HuggingFace Transformers v5 для ускорения обучения MoE

Суть: Библиотека NVIDIA NeMo AutoModel интегрируется с обновленным фреймворком HuggingFace Transformers v5 для оптимизации дообучения моделей архитектуры Mixture-of-Experts. Решение обеспечивает рост пропускной способности в 3,4–3,7 раза и снижение потребления видеопамяти GPU на 29–32% по сравнению с нативной реализацией в HuggingFace Transformers v5.

Событие: Тестирование показало, что стандартная версия HuggingFace Transformers v5 зависала на модели Qwen3-30B-A3B, тогда как интеграция с NeMo AutoModel обеспечила стабильную работу и ускорение в 3,69 раза. На модели Nemotron 3 Ultra 550B HuggingFace Transformers v5 не запустилась из-за нехватки памяти, в то время как оптимизированное решение выполнило задачу.

Фактор: Для активации оптимизаций разработчику достаточно изменить одну строку импорта, сохраняя полную совместимость API без переписывания логики кода. Библиотека использует специализированные механизмы, такие как Экспертный параллелизм и DeepEP, которые строятся на базе обновлений HuggingFace Transformers v5.

Эффект: Снижение потребления памяти на 30% позволяет увеличить размер пакета или длину последовательности, напрямую влияя на качество обучения. Сохраненные чекпоинты имеют стандартный формат HuggingFace, что гарантирует их загрузку в фреймворки для инференса без дополнительных конвертаций.

Подробнее →


HuggingFace Transformers v5 имеет 1 запись событий в нашей базе.