Открытые языковые модели


Открытые языковые модели в новостной повестке, упоминания и aналитика в реальном времени.

Календарь упоминаний:

2025
15 декабря

Открытые языковые модели как платформа для агентных ИИ-систем

NVIDIA представила новую версию открытых языковых моделей Nemotron 3, позиционируя их как базу для агентных ИИ-систем. Модель не только отвечает на вопросы, но и выполняет сложные задачи с помощью внешних инструментов. В отличие от закрытых решений, Nemotron 3 делает доступными веса, данные и рецепты обучения, что расширяет возможности их применения. В будущем планируется выпуск версии Nemotron 3 Ultra с 500 миллиардами параметров, которая войдёт в число крупнейших открытых моделей в мире. Подробнее →

01 октября

Снижение вычислительных затрат через оптимизацию внимания

Открытые языковые модели, такие как DeepSeek-V3.2-Exp, применяют новую архитектуру «DeepSeek Sparse Attention», которая позволяет сократить вычислительную нагрузку при обработке длинных текстов. Вместо полного анализа всех связей между словами модель фокусируется только на наиболее важных, используя для этого компоненту «lightning indexer». Это позволяет уменьшить количество необходимых вычислений без потери качества понимания текста. Модель доступна под лицензией MIT, что способствует её применению в исследовательских и коммерческих целях. Подробнее →


Открытые языковые модели имеет 2записи событий в нашей базе.
Объединили похожие карточки: Открытые языковые модели; Модели искусственного языкового интеллекта с открытым доступом; Открытые модели обработки естественного языка и другие.

Открытые языковые модели упоминается в материалах