Декабрь 2025   |   Обзор события   | 7

NVIDIA представила Nemotron 3 — мощную ИИ-инфраструктуру для агентов будущего

Компания NVIDIA представила новую линейку ИИ-моделей Nemotron 3, позиционируя её как инфраструктурное решение для построения собственных ИИ-агентов с возможностью локального развертывания. Три варианта модели — Nano, Super и Ultra — отличаются по масштабу и предназначению, а открытость данных и библиотек делает их доступными для настройки под конкретные задачи бизнеса.

ИСХОДНЫЙ НАРРАТИВ

Новости ИИ-инфраструктуры: Новый подход от NVIDIA

По данным Computerworld, компания NVIDIA представила новую линейку моделей Nemotron 3, которая позиционируется как инфраструктурное решение для построения ИИ-агентов. Эксперты отмечают, что это решение направлено не на конкуренцию с API-провайдерами, а на обеспечение гибкости и контроля для компаний, создающих собственные ИИ-системы.

Три варианта Nemotron 3 и их назначение

Новая линейка включает три модели: Nemotron 3 Nano, Super и Ultra, каждая из которых предназначена для решения определённых задач.

  • Nemotron 3 Nano — самая компактная и эффективная модель, ориентированная на быстрые задачи, такие как поиск информации, отладка программного обеспечения, суммирование текстов и поддержка ИИ-ассистентов. Модель активирует 3 миллиарда параметров из 30 миллиардов, что обеспечивает высокую скорость и широкое окно контекста — 1 миллион токенов.
  • Nemotron 3 Super — расширенная модель с 100 миллиардами параметров, из которых до 10 миллиардов активируются одновременно. Она предназначена для сложных задач, требующих взаимодействия множества агентов, таких как глубокий анализ и стратегическое планирование.
  • Nemotron 3 Ultra — самая крупная модель с 500 миллиардами параметров, которая будет использоваться для самых сложных ИИ-приложений, включая исследовательские и аналитические процессы.

Инфраструктурный подход NVIDIA

По мнению экспертов, NVIDIA позиционирует Nemotron 3 как инфраструктурный слой, а не готовое API-решение. Это означает, что компания предоставляет инструменты для разработки и настройки ИИ-агентов под конкретные нужды бизнеса. Wyatt Mayham из Northwest AI Consulting отмечает, что это стратегический шаг, позволяющий избежать зависимости от сторонних провайдеров.

Гибридная архитектура и производительность

Одним из ключевых элементов Nemotron 3 является гибридная архитектура, объединяющая Mamba, Transformer и Mixture-of-Experts (MoE). Эта комбинация обеспечивает высокую производительность и эффективность вычислений. По данным третьей стороны, модель Nemotron 3 Nano демонстрирует лучшие показатели эффективности среди аналогичных по размеру моделей.

NVIDIA утверждает, что новая архитектура позволяет увеличить пропускную способность в четыре раза по сравнению с предыдущей версией и снизить объём генерации токенов для рассуждений на 60%. Это снижает затраты на инференс и улучшает отзывчивость агентов в реальном времени.

Открытость как конкурентное преимущество

Одним из ключевых аспектов запуска Nemotron 3 стало решение NVIDIA сделать часть инфраструктуры и данных доступной для всех. Компания опубликовала:

  • 3 триллиона токенов, использованных для предварительного обучения и пост-обучения;
  • Датасеты для оценки безопасности;
  • Библиотеки NeMo Gym, NeMo RL и NeMo Evaluator, предназначенные для настройки и проверки моделей.

Wyatt Mayham называет NeMo Gym наиболее стратегически важной частью пакета. Эта платформа позволяет разработчикам создавать собственные системы обучения с подтверждёнными результатами, а не только на основе субъективных оценок.

Ценовая привлекательность

Пользователи могут бесплатно загрузить модели и запускать их локально. Варианты через API доступны на DeepInfra, где стоимость использования Nemotron 3 Nano составляет $0,06 за миллион входных токенов. Это делает модель заметно дешевле по сравнению с GPT-4o, отмечает Mayham.

Текущая доступность и планы

Сейчас Nemotron 3 Nano доступна на Hugging Face и через другие платформы инференса. В ближайшее время модель будет доступна через Amazon Bedrock, а также на Google Cloud, CoreWeave и Microsoft Foundry.

Модели Super и Ultra планируется выпустить в первой половине 2026 года.

Интересно: Как сочетание открытости, гибкости и производительности может изменить подходы к разработке ИИ-агентов в крупных компаниях, и насколько это уменьшит зависимость от закрытых решений.

Концептуальное изображение
Создано специально для ASECTOR
Концептуальное изображение

АНАЛИТИЧЕСКИЙ РАЗБОР

NVIDIA Nemotron 3: Переход от API-зависимости к открытой ИИ-инфраструктуре

NVIDIA продолжает укреплять своё лидерство в области искусственного интеллекта, представив третью версию модели Nemotron, которая позиционируется как открытая платформа для агентных ИИ-систем [!]. Линейка включает модели Nano, Super и Ultra, каждая из которых рассчитана на разные уровни сложности задач и объём вычислений. Эта стратегия позволяет компаниям создавать ИИ-агентов с высокой степенью гибкости и контроля, что особенно важно в условиях роста спроса на инфраструктуру искусственного интеллекта и увеличения зависимости от закрытых решений.

Открытость как стратегический элемент

Отличительной чертой Nemotron 3 является не только доступность моделей, но и открытость всей инфраструктуры. NVIDIA опубликовала 3 триллиона токенов, использованных для обучения, а также датасеты для оценки безопасности и библиотеки, такие как NeMo Gym, NeMo RL и NeMo Evaluator. Эти инструменты позволяют разработчикам не только настраивать модели, но и проверять их в условиях, приближенных к реальным.

Важный нюанс: Открытая архитектура снижает барьеры для внедрения ИИ и ускоряет цикл разработки. Это особенно важно для компаний, где ИИ становится не только инструментом, а частью стратегии. Например, NeMo Gym позволяет создавать системы с подтверждёнными результатами, что снижает риски, связанные с внедрением ИИ в критически важных процессах.

Гибридная архитектура и производительность

Nemotron 3 построена на гибридной архитектуре, объединяющей Mamba, Transformer и Mixture-of-Experts (MoE). Такой подход обеспечивает высокую производительность и эффективность вычислений. Модель Nemotron 3 Nano, например, может активировать 3 миллиарда параметров из 30 миллиардов, что позволяет ей работать быстро и с широким контекстом. Это делает её подходящей для задач, где важна отзывчивость, но не требуется максимальная мощность.

Стоит отметить, что производительность Nemotron 3 не ограничивается только размером модели. NVIDIA добилась десятикратного роста производительности в моделях MoE, используя подход co-design, который сочетает оптимизацию архитектуры и программного обеспечения. Это стало возможным благодаря серверу GB200 NVL72, построенному на архитектуре Blackwell [!]. Такие достижения делают Nemotron 3 не только конкурентоспособным, а стратегически важным элементом для компаний, стремящихся к масштабированию ИИ-проектов.

Экономическая выгода и масштабируемость

Стоимость использования Nemotron 3 Nano через API составляет $0,06 за миллион входных токенов, что делает модель заметно дешевле по сравнению с аналогами. Это особенно важно для компаний, ищущих экономичные решения. При этом модель можно использовать локально, что снижает риски, связанные с передачей данных в облако. Для крупных предприятий, особенно тех, что работают с чувствительной информацией, это может быть решающим фактором.

Важный нюанс: Рост спроса на ИИ-инфраструктуру приводит к увеличению потребности в энергетическом хранении. Например, Ford перенаправляет ресурсы с электромобилей на производство батарей для дата-центров, чтобы удовлетворить растущие потребности рынка [!]. Это подчеркивает, что ИИ не только меняет программные решения, но и влияет на энергетическую инфраструктуру.

Российский контекст и долгосрочные перспективы

Для российских компаний Nemotron 3 может стать важным инструментом в условиях ограничений на доступ к западным технологиям. Открытость модели и доступность инфраструктуры позволяют снизить зависимость от закрытых решений, что особенно важно при формировании собственной ИИ-экосистемы. Однако, ключевой вызов — это необходимость в развитии локальной инфраструктуры и квалификации специалистов.

Использование Nemotron 3 требует не только технической подготовки, но и понимания, как интегрировать ИИ в бизнес-процессы. Это открывает возможности для роста ИИ-сервисов и консалтинга в стране. Важно также учитывать, что 89% компаний не получили ожидаемой от ИИ ценности, несмотря на увеличение инвестиций в технологии [!]. Основными барьерами остаются высокие затраты на развертывание, проблемы с приватностью данных и сложности интеграции с существующими системами.

Заключение

NVIDIA Nemotron 3 — это не только ещё одна модель искусственного интеллекта. Это стратегический шаг в сторону открытой и гибкой ИИ-инфраструктуры, которая позволяет компаниям управлять своими данными, снижать затраты и ускорять внедрение решений. В условиях роста спроса на ИИ-инфраструктуру и увеличения зависимости от закрытых решений, Nemotron 3 может стать важным элементом для бизнеса, стремящегося к независимости и масштабируемости.

Коротко о главном

Какие три модели входят в линейку Nemotron 3 и чем они отличаются?

Линейка включает Nemotron 3 Nano (3 млрд активных параметров из 30 млрд), Super (до 10 млрд активных из 100 млрд) и Ultra (500 млрд параметров), каждая из которых предназначена для задач разной сложности — от быстрой обработки до исследовательских вычислений.

Какова производительность Nemotron 3 Nano?

Модель Nemotron 3 Nano показывает лучшую эффективность среди аналогичных по размеру моделей, увеличив пропускную способность в 4 раза по сравнению с предыдущей версией и снизив объём генерации токенов на 60%.

Какую архитектуру используют модели Nemotron 3?

Модели используют гибридную архитектуру, объединяющую Mamba, Transformer и Mixture-of-Experts, что обеспечивает высокую производительность и эффективность вычислений.

Как NVIDIA делает Nemotron 3 доступной?

NVIDIA опубликовала 3 триллиона токенов, датасеты для оценки безопасности и библиотеки NeMo Gym, NeMo RL и NeMo Evaluator, что позволяет разработчикам настраивать и проверять модели самостоятельно.

Какова стоимость использования Nemotron 3 Nano через API?

Стоимость использования Nemotron 3 Nano через DeepInfra составляет $0,06 за миллион входных токенов, что делает её более экономичной по сравнению с GPT-4o.

Когда планируется выпуск всех моделей Nemotron 3?

Nemotron 3 Nano уже доступна, а модели Super и Ultra запланированы к выпуску в первой половине 2026 года.

Инфографика событий

Открыть инфографику на весь экран


Участники и связи

Отрасли: ИТ и программное обеспечение; Искусственный интеллект (AI); Кибербезопасность; Разработка ПО; Бизнес; Цифровизация и технологии; Передовые технологии

Оценка значимости: 7 из 10

Новинка NVIDIA в области ИИ-инфраструктуры может заинтересовать российскую аудиторию, особенно технических специалистов и компаний, занимающихся разработкой ИИ-систем. Масштаб аудитории охватывает как национальный, так и глобальный уровень, учитывая значимость ИИ для будущих технологий. Событие имеет среднесрочные перспективы и затрагивает несколько сфер — технологии, экономику и бизнес. Глубина последствий для России возрастает из-за потенциального влияния на снижение зависимости от иностранных API и развитие собственной ИИ-инфраструктуры.

Материалы по теме

NVIDIA делает ИИ доступным: открытые модели Nemotron 3 для всех

Упоминание Nemotron 3 как открытой платформы для агентных ИИ-систем с доступными версиями Nano, Super и Ultra служит основой для аргументации стратегии NVIDIA по снижению зависимости от закрытых решений. Конкретизация параметров модели (включая 500 миллиардов упомянутых параметров в Ultra) подчеркивает её масштаб и потенциал для интеграции в бизнес-процессы.

Подробнее →
NVIDIA преодолела барьеры масштабирования моделей MoE

Данные о десятикратном росте производительности моделей MoE благодаря серверу GB200 NVL72 и архитектуре Blackwell используются для подтверждения утверждений о стратегической важности Nemotron 3. Это усиливает тезис о том, что модель не просто конкурентоспособна, но и способна масштабироваться в условиях растущих требований к ИИ-инфраструктуре.

Подробнее →
Ford переключается на батареи для дата-центров и домов, сокращая инвестиции в электромобили

Информация о том, что Ford перенаправляет ресурсы с электромобилей на производство батарей для дата-центров, используется как пример масштабного влияния ИИ на энергетическую инфраструктуру. Это усиливает аргумент о том, что ИИ меняет не только программные, но и физические аспекты экономики.

Подробнее →
89% компаний не получили ожидаемой от AI ценности: барьеры и пути развития

Цифра 89% компаний, которые не получили ожидаемой от ИИ ценности, служит ключевым аргументом в разделе о российском контексте. Она подчеркивает сложность внедрения ИИ и важность открытых решений, таких как Nemotron 3, для преодоления барьеров, связанных с интеграцией и затратами.

Подробнее →