NVIDIA представила Nemotron 3 — мощную ИИ-инфраструктуру для агентов будущего
Компания NVIDIA представила новую линейку ИИ-моделей Nemotron 3, позиционируя её как инфраструктурное решение для построения собственных ИИ-агентов с возможностью локального развертывания. Три варианта модели — Nano, Super и Ultra — отличаются по масштабу и предназначению, а открытость данных и библиотек делает их доступными для настройки под конкретные задачи бизнеса.
Новости ИИ-инфраструктуры: Новый подход от NVIDIA
По данным Computerworld, компания NVIDIA представила новую линейку моделей Nemotron 3, которая позиционируется как инфраструктурное решение для построения ИИ-агентов. Эксперты отмечают, что это решение направлено не на конкуренцию с API-провайдерами, а на обеспечение гибкости и контроля для компаний, создающих собственные ИИ-системы.
Три варианта Nemotron 3 и их назначение
Новая линейка включает три модели: Nemotron 3 Nano, Super и Ultra, каждая из которых предназначена для решения определённых задач.
- Nemotron 3 Nano — самая компактная и эффективная модель, ориентированная на быстрые задачи, такие как поиск информации, отладка программного обеспечения, суммирование текстов и поддержка ИИ-ассистентов. Модель активирует 3 миллиарда параметров из 30 миллиардов, что обеспечивает высокую скорость и широкое окно контекста — 1 миллион токенов.
- Nemotron 3 Super — расширенная модель с 100 миллиардами параметров, из которых до 10 миллиардов активируются одновременно. Она предназначена для сложных задач, требующих взаимодействия множества агентов, таких как глубокий анализ и стратегическое планирование.
- Nemotron 3 Ultra — самая крупная модель с 500 миллиардами параметров, которая будет использоваться для самых сложных ИИ-приложений, включая исследовательские и аналитические процессы.
Инфраструктурный подход NVIDIA
По мнению экспертов, NVIDIA позиционирует Nemotron 3 как инфраструктурный слой, а не готовое API-решение. Это означает, что компания предоставляет инструменты для разработки и настройки ИИ-агентов под конкретные нужды бизнеса. Wyatt Mayham из Northwest AI Consulting отмечает, что это стратегический шаг, позволяющий избежать зависимости от сторонних провайдеров.
Гибридная архитектура и производительность
Одним из ключевых элементов Nemotron 3 является гибридная архитектура, объединяющая Mamba, Transformer и Mixture-of-Experts (MoE). Эта комбинация обеспечивает высокую производительность и эффективность вычислений. По данным третьей стороны, модель Nemotron 3 Nano демонстрирует лучшие показатели эффективности среди аналогичных по размеру моделей.
NVIDIA утверждает, что новая архитектура позволяет увеличить пропускную способность в четыре раза по сравнению с предыдущей версией и снизить объём генерации токенов для рассуждений на 60%. Это снижает затраты на инференс и улучшает отзывчивость агентов в реальном времени.
Открытость как конкурентное преимущество
Одним из ключевых аспектов запуска Nemotron 3 стало решение NVIDIA сделать часть инфраструктуры и данных доступной для всех. Компания опубликовала:
- 3 триллиона токенов, использованных для предварительного обучения и пост-обучения;
- Датасеты для оценки безопасности;
- Библиотеки NeMo Gym, NeMo RL и NeMo Evaluator, предназначенные для настройки и проверки моделей.
Wyatt Mayham называет NeMo Gym наиболее стратегически важной частью пакета. Эта платформа позволяет разработчикам создавать собственные системы обучения с подтверждёнными результатами, а не только на основе субъективных оценок.
Ценовая привлекательность
Пользователи могут бесплатно загрузить модели и запускать их локально. Варианты через API доступны на DeepInfra, где стоимость использования Nemotron 3 Nano составляет $0,06 за миллион входных токенов. Это делает модель заметно дешевле по сравнению с GPT-4o, отмечает Mayham.
Текущая доступность и планы
Сейчас Nemotron 3 Nano доступна на Hugging Face и через другие платформы инференса. В ближайшее время модель будет доступна через Amazon Bedrock, а также на Google Cloud, CoreWeave и Microsoft Foundry.
Модели Super и Ultra планируется выпустить в первой половине 2026 года.
Интересно: Как сочетание открытости, гибкости и производительности может изменить подходы к разработке ИИ-агентов в крупных компаниях, и насколько это уменьшит зависимость от закрытых решений.

NVIDIA Nemotron 3: Переход от API-зависимости к открытой ИИ-инфраструктуре
NVIDIA продолжает укреплять своё лидерство в области искусственного интеллекта, представив третью версию модели Nemotron, которая позиционируется как открытая платформа для агентных ИИ-систем [!]. Линейка включает модели Nano, Super и Ultra, каждая из которых рассчитана на разные уровни сложности задач и объём вычислений. Эта стратегия позволяет компаниям создавать ИИ-агентов с высокой степенью гибкости и контроля, что особенно важно в условиях роста спроса на инфраструктуру искусственного интеллекта и увеличения зависимости от закрытых решений.
Открытость как стратегический элемент
Отличительной чертой Nemotron 3 является не только доступность моделей, но и открытость всей инфраструктуры. NVIDIA опубликовала 3 триллиона токенов, использованных для обучения, а также датасеты для оценки безопасности и библиотеки, такие как NeMo Gym, NeMo RL и NeMo Evaluator. Эти инструменты позволяют разработчикам не только настраивать модели, но и проверять их в условиях, приближенных к реальным.
Важный нюанс: Открытая архитектура снижает барьеры для внедрения ИИ и ускоряет цикл разработки. Это особенно важно для компаний, где ИИ становится не только инструментом, а частью стратегии. Например, NeMo Gym позволяет создавать системы с подтверждёнными результатами, что снижает риски, связанные с внедрением ИИ в критически важных процессах.
Гибридная архитектура и производительность
Nemotron 3 построена на гибридной архитектуре, объединяющей Mamba, Transformer и Mixture-of-Experts (MoE). Такой подход обеспечивает высокую производительность и эффективность вычислений. Модель Nemotron 3 Nano, например, может активировать 3 миллиарда параметров из 30 миллиардов, что позволяет ей работать быстро и с широким контекстом. Это делает её подходящей для задач, где важна отзывчивость, но не требуется максимальная мощность.
Стоит отметить, что производительность Nemotron 3 не ограничивается только размером модели. NVIDIA добилась десятикратного роста производительности в моделях MoE, используя подход co-design, который сочетает оптимизацию архитектуры и программного обеспечения. Это стало возможным благодаря серверу GB200 NVL72, построенному на архитектуре Blackwell [!]. Такие достижения делают Nemotron 3 не только конкурентоспособным, а стратегически важным элементом для компаний, стремящихся к масштабированию ИИ-проектов.
Экономическая выгода и масштабируемость
Стоимость использования Nemotron 3 Nano через API составляет $0,06 за миллион входных токенов, что делает модель заметно дешевле по сравнению с аналогами. Это особенно важно для компаний, ищущих экономичные решения. При этом модель можно использовать локально, что снижает риски, связанные с передачей данных в облако. Для крупных предприятий, особенно тех, что работают с чувствительной информацией, это может быть решающим фактором.
Важный нюанс: Рост спроса на ИИ-инфраструктуру приводит к увеличению потребности в энергетическом хранении. Например, Ford перенаправляет ресурсы с электромобилей на производство батарей для дата-центров, чтобы удовлетворить растущие потребности рынка [!]. Это подчеркивает, что ИИ не только меняет программные решения, но и влияет на энергетическую инфраструктуру.
Российский контекст и долгосрочные перспективы
Для российских компаний Nemotron 3 может стать важным инструментом в условиях ограничений на доступ к западным технологиям. Открытость модели и доступность инфраструктуры позволяют снизить зависимость от закрытых решений, что особенно важно при формировании собственной ИИ-экосистемы. Однако, ключевой вызов — это необходимость в развитии локальной инфраструктуры и квалификации специалистов.
Использование Nemotron 3 требует не только технической подготовки, но и понимания, как интегрировать ИИ в бизнес-процессы. Это открывает возможности для роста ИИ-сервисов и консалтинга в стране. Важно также учитывать, что 89% компаний не получили ожидаемой от ИИ ценности, несмотря на увеличение инвестиций в технологии [!]. Основными барьерами остаются высокие затраты на развертывание, проблемы с приватностью данных и сложности интеграции с существующими системами.
Заключение
NVIDIA Nemotron 3 — это не только ещё одна модель искусственного интеллекта. Это стратегический шаг в сторону открытой и гибкой ИИ-инфраструктуры, которая позволяет компаниям управлять своими данными, снижать затраты и ускорять внедрение решений. В условиях роста спроса на ИИ-инфраструктуру и увеличения зависимости от закрытых решений, Nemotron 3 может стать важным элементом для бизнеса, стремящегося к независимости и масштабируемости.
Источник: computerworld.com