Февраль 2026 | Обзор события | 6

NVIDIA Blackwell Ultra: производительность в 1,5 раза выше в задачах с низкой латентностью

NVIDIA вывела производительность агентных ИИ-систем на новый уровень, разделив обработку запросов между узлами и сократив латентность в 58 раз — что ставит под угрозу текущий баланс сил в сфере крупномасштабных вычислений. Такой скачок эффективности меняет правила игры для облаков и гиперскейлеров, вынуждая их пересматривать стратегии масштабирования и выбора оборудования.

Содержание

Обзор

Сравнение показателей GB300 NVL72 и GB200 NVL72

Оптимизация для масштабных вычислений

Таблица сравнения показателей

Продолжающаяся трансформация архитектуры

Баланс между производительностью и устойчивостью: как NVIDIA меняет ИИ-инфраструктуру
- Рост производительности как стратегический приоритет
- Инфраструктурные вызовы и зависимости
- Геополитические и экономические риски
- Экономические аспекты: стоимость владения и масштабирование
- Инвестиции и инфраструктурный бум
- Заключение: баланс между скоростью и устойчивостью

ИСХОДНЫЙ НАРРАТИВ

По данным Wccftech, компания NVIDIA провела тестирование своих систем GB300 NVL72 на базе архитектуры Blackwell Ultra с участием последних открытых моделей DeepSeek. Результаты демонстрируют значительное улучшение характеристик в задачах, где важна скорость обработки. В частности, Blackwell Ultra обеспечивает в 1,5 раза более высокую производительность по сравнению с предыдущей версией — GB200 NVL72 — в сценариях, чувствительных к латентности.

Эксперты отмечают, что NVIDIA сосредоточилась на улучшении обработки длинных контекстов, что особенно важно для агентных систем искусственного интеллекта. В рамках тестов, проведённых организацией Large Model Systems Organization (LMSYS), было применено несколько оптимизационных методов, включая PD Disaggregation — подход, позволяющий разделить обработку запросов между разными узлами, чтобы избежать узких мест.

Этот метод позволяет разделить процесс на две фазы: prefill — обработка входного запроса, и decode — генерация токенов. Такой подход увеличивает пропускную способность и делает масштабирование более эффективным. В дополнение к PD Disaggregation, были использованы динамическое разделение запросов и оптимизация ёмкости KV-кэша, что позволило добиться улучшения характеристик.

Сравнение показателей GB300 NVL72 и GB200 NVL72

Тестирование показало, что GB300 NVL72 обеспечивает значительное увеличение производительности по сравнению с предыдущей версией. Основные показатели включают:

Пиковая пропускная способность: 226,2 токена в секунду на GPU (TPS/GPU), что в 53 раза выше, чем у предшественника.
Скорость работы на пользовательском уровне: увеличение в 87 раз благодаря MTP (Multi-Token Prediction).
Снижение латентности: улучшение на 58 раз.

По данным LMSYS, в среднем GB300 опережает GB200 в 1,4–1,5 раза, особенно в задачах с высокими требованиями к времени отклика. Это делает Blackwell Ultra особенно привлекательным для крупных облачных провайдеров и гиперскейлеров, где требуется высокая производительность и низкая задержка.

Концептуальное изображение

Оптимизация для масштабных вычислений

NVIDIA продолжает совершенствовать не только архитектуру своих чипов, но и подходы к решению промышленных задач. В случае Blackwell Ultra ключевое внимание уделено улучшению показателей латентности, что особенно важно для агентных систем искусственного интеллекта. Эксперты указывают, что такой фокус позволяет GB300 выделяться среди конкурентов и обеспечивает его популярность в крупных вычислительных системах.

Однако, несмотря на улучшение в производительности, пока не приведены данные о стоимости владения (TCO), что остаётся важным фактором при выборе оборудования для масштабных решений. Увеличение стоимости развертывания в сочетании с ростом возможностей требует тщательного анализа со стороны заказчиков.

Таблица сравнения показателей

Показатель	GB300 NVL72	GB200 NVL72
Пиковая пропускная способность (TPS/GPU)	226,2	4,26
Скорость на пользовательском уровне (TPS/пользователь)	×87	—
Снижение латентности	×58	—
Среднее улучшение по сравнению с GB200	1,4–1,5 раза	—

Продолжающаяся трансформация архитектуры

Разработка новых поколений оборудования демонстрирует, что NVIDIA не ограничивается улучшением отдельных компонентов, а стремится к комплексной оптимизации. Такие подходы, как PD Disaggregation и MTP, позволяют не только повысить производительность, но и адаптировать оборудование под конкретные задачи. Это особенно важно для отраслей, где требуется обработка больших объёмов данных с минимальной задержкой.

Эксперты отмечают, что с ростом сложности моделей искусственного интеллекта и увеличением объёмов данных, требования к аппаратным ресурсам становятся всё жёстче. NVIDIA, по их мнению, справляется с этим вызовом, предлагая решения, которые соответствуют современным требованиям.

АНАЛИТИЧЕСКИЙ РАЗБОР

Баланс между производительностью и устойчивостью: как NVIDIA меняет ИИ-инфраструктуру

Рост производительности как стратегический приоритет

NVIDIA продолжает укреплять позиции в сфере искусственного интеллекта, представив платформу Blackwell Ultra, которая демонстрирует рекордную пропускную способность 130 ТБ/с. Это стало возможным благодаря объединению 72 GPU в единую сеть NVLink. По сравнению с предыдущей архитектурой, Blackwell Ultra в 50 раз повышает энергоэффективность и сокращает стоимость обработки токенов в 35 раз. Такой рост производительности делает Blackwell ключевым элементом для гиперскейлеров и облачных провайдеров, где требуется низкая задержка и высокая пропускная способность.

Особое внимание компания уделяет оптимизации агентных систем искусственного интеллекта. Скорость обработки внимания в таких системах увеличена в 2 раза, а стоимость токена сокращена в 1,5 раза. Это позволяет Blackwell Ultra опережать аналоги в задачах, где важна точность и скорость реакции.

Инфраструктурные вызовы и зависимости

Достижение таких высоких показателей требует значительных изменений в подходах к инфраструктуре. Основной драйвер роста — стандарт HBM4, который становится де-факто новой нормой для ИИ-ускорителей. Samsung, SK hynix и Micron уже адаптируют производственные мощности, чтобы соответствовать повышенным требованиям к пропускной способности и термическим характеристикам. HBM4 обеспечивает до 3,3 ТБ/с на стек и объём памяти до 48 ГБ, что позволяет снизить трудности при работе с масштабными ИИ-моделями.

Важный нюанс: Однако рост зависимости от HBM4 и других высокотехнологичных компонентов создаёт новые риски. Например, Южная Корея столкнулась с проблемами доступа к Blackwell после заявлений президента США, ограничивающего доступ к таким технологиям только для американских клиентов. Это может задержать реализацию крупных проектов в области искусственного интеллекта, особенно в регионах, где инфраструктура ещё не полностью сформирована.

Геополитические и экономические риски

Введение ограничений на поставки Blackwell в Китай усилило конкуренцию за доступ к передовым ИИ-чипам. Китайские регуляторы рассматривают возможность ограничения доступа к этим чипам, что может снизить коммерческий потенциал NVIDIA в регионе. По оценке Джин Хуана, такие меры стимулируют Китай к ускорению разработки собственных альтернатив, что ускоряет развитие локальной полупроводниковой отрасли.

Важный нюанс: Для российских компаний важно учитывать, что глобальные регулирования и геополитические факторы могут ограничивать доступ к передовым технологиям. Это требует пересмотра стратегий закупок и логистики, а также усиления фокуса на локальных разработках и адаптации инфраструктуры под доступные решения.

Экономические аспекты: стоимость владения и масштабирование

Одним из ключевых факторов, влияющих на выбор оборудования для масштабных решений, остаётся стоимость владения (TCO). Увеличение производительности часто сопровождается ростом энергозатрат, что может стать узким местом, если инфраструктура для охлаждения и питания не обеспечена. Например, сервер GB200 NVL72 рассчитан на нагрузку свыше 120 киловатт, что требует значительных инвестиций в энергетическую систему дата-центра.

Кроме того, рост сложности архитектуры увеличивает затраты на обслуживание и обучение персонала. Это особенно чувствительно для регионов, где доступ к высококвалифицированным специалистам ограничен. Для облачных провайдеров, которым обещана высокая производительность и низкая задержка, рост стоимости владения становится критическим фактором. Даже если технические характеристики выглядят привлекательно, итоговая стоимость может быть выше, чем у менее производительных, но более экономичных решений.

Инвестиции и инфраструктурный бум

Рост капитальных вложений в ИИ превышает $100 млрд, что формирует новую инфраструктуру, меняющую природу программного обеспечения. NVIDIA отмечает, что рост инвестиций — это долгосрочный процесс, а не краткосрочный спринт. Спрос на ИИ-решения остаётся высоким из-за их новой полезности, особенно в таких секторах, как научные вычисления, медицина и финансы.

Важный нюанс: Для российского бизнеса важно не только учитывать технические характеристики, но и оценивать долгосрочные экономические последствия внедрения таких решений. Без тщательного анализа текущих систем и готовности к переходу на более сложные технологии даже самые привлекательные обещания производительности могут стать камнем преткновения.

Заключение: баланс между скоростью и устойчивостью

NVIDIA продемонстрировала, что её новая архитектура Blackwell Ultra способна достичь высоких показателей производительности. Однако для бизнеса важно не только увидеть цифры, но и понять, какие риски они несут. Увеличение сложности, рост затрат на обслуживание, зависимость от одного производителя — все это факторы, которые могут оказать обратное влияние на успех проекта.

Для российских компаний, рассматривая внедрение таких решений, особенно важно провести аудит текущих систем и оценить, насколько они готовы к переходу на более сложные и требовательные технологии. Без этого даже самые привлекательные обещания производительности могут стать камнем преткновения.

Источник: wccftech.com

Контакты Асектор ✉

Коротко о главном

Во сколько раз увеличилась скорость работы на пользовательском уровне у GB300?

Скорость работы на пользовательском уровне выросла в 87 раз благодаря использованию технологии MTP (Multi-Token Prediction). Это позволяет системе обрабатывать несколько токенов одновременно, что ускоряет генерацию ответов.

Почему NVIDIA внедрила метод PD Disaggregation?

NVIDIA внедрила PD Disaggregation, чтобы разделить обработку запросов на фазы prefill и decode между разными узлами. Это помогло избежать узких мест и повысить общую пропускную способность системы.

На сколько снизилась латентность в системе GB300 NVL72?

Латентность в системе GB300 NVL72 снизилась в 58 раз по сравнению с предыдущей версией. Такое улучшение делает систему особенно привлекательной для задач, где важна скорость отклика.

Какое среднее улучшение производительности показывает GB300 NVL72 по сравнению с GB200 NVL72?

В среднем GB300 NVL72 демонстрирует улучшение производительности в 1,4–1,5 раза по сравнению с GB200 NVL72, особенно в задачах с высокими требованиями к времени отклика.

Почему NVIDIA уделяет внимание улучшению латентности?

NVIDIA фокусируется на снижении латентности, чтобы соответствовать требованиям агентных систем искусственного интеллекта, где важна быстрая обработка и генерация ответов. Это делает Blackwell Ultra востребованным у гиперскейлеров и облачных провайдеров.

Почему не указаны данные о стоимости владения (TCO) для GB300?

В тексте отмечается, что данные о стоимости владения (TCO) пока не предоставлены, что может затруднить принятие решений о развертывании системы для масштабных вычислений. Увеличение возможностей оборудования требует дополнительного анализа затрат.

Инфографика событий

Открыть инфографику на весь экран

Участники и связи

Отрасли: ИТ и программное обеспечение; Искусственный интеллект (AI); Кибербезопасность; Бизнес; Цифровизация и технологии; Передовые технологии

Темы: Архитектура ИИ-процессоров; Оптимизация латентности;

Оценка значимости: 6 из 10

Событие связано с техническим прогрессом в области искусственного интеллекта, что касается регионального уровня интереса в России, так как технологии ИИ становятся важной сферой для страны. Улучшение производительности оборудования NVIDIA может косвенно повлиять на развитие отечественных ИИ-проектов, особенно в научных и промышленных кругах. Время воздействия умеренное — технологии внедряются постепенно. Влияние затрагивает несколько сфер: технологии, наука, промышленность. Однако прямого влияния на широкую российскую аудиторию нет, а глубина последствий пока остаётся ограниченной.

Материалы по теме

Blackwell Ultra ускоряет ИИ в 2 раза: зачем гиперскалерам переплатить за старые чипы

Рекордная пропускная способность Blackwell Ultra в 130 ТБ/с, объединение 72 GPU в сеть NVLink, 50-кратное повышение энергоэффективности и сокращение стоимости обработки токенов в 35 раз — всё это подкрепляет тезис о стратегическом приоритете производительности и демонстрирует, как Blackwell Ultra меняет парадигму ИИ-инфраструктуры. Удвоение скорости обработки внимания в агентных системах и снижение затрат на токен в 1,5 раза усиливают аргумент о преимуществах решения для гиперскейлеров.

Подробнее →

Samsung берет верх в гонке HBM4: как ИИ-бум делает память новой валютой дата-центров

Упоминание HBM4 с пропускной способностью 3,3 ТБ/с на стек и объёмом памяти до 48 ГБ служит аргументом в пользу того, что HBM4 становится новой нормой для ИИ-ускорителей, снижая бутылочные горлышки при работе с масштабными моделями. Это поддерживает идею о важности стандартов памяти в обеспечении эффективности дата-центров.

Подробнее →

Южная Корея в три раза увеличивает бюджет на искусственный интеллект

Упоминание ограничений доступа к Blackwell в Южной Корее после заявлений президента США усиливает тезис о геополитических рисках, связанных с зависимостью от передовых ИИ-чипов. Это подчёркивает, как глобальные регулирования могут задерживать развитие ИИ-инфраструктуры в регионах с недостаточной готовностью.

Подробнее →

Китай обгоняет США в гонке за искусственный интеллект — заявление NVIDIA

Упоминание экспортных ограничений на Blackwell и их влияние на долю NVIDIA в Китае служит примером того, как геополитика может стимулировать развитие локальной полупроводниковой отрасли. Это поддерживает аргумент о том, что такие меры могут усилить конкуренцию и ускорить технологическое развитие в странах-импортерах.

Подробнее →

NVIDIA создала AI-сервер, который превзошёл Hopper в 10 раз

Упоминание сервера GB200 NVL72, включающего 72 чипа и 30 ТБ памяти, с 10-кратным превосходством над Hopper HGX 200 используется для подтверждения тезиса о росте производительности в масштабных ИИ-системах. Это подчеркивает важность совместного проектирования архитектуры и программного обеспечения для достижения высоких результатов.

Подробнее →

ИИ-инвестиции растут вопреки скептицизму: как инфраструктура меняет бизнес

Упоминание капитальных вложений в ИИ, превышающих $100 млрд, и долгосрочной стратегии NVIDIA формируют основу для аргумента о том, что рост инвестиций в ИИ-инфраструктуру — это устойчивая тенденция, а не краткосрочный спринт. Это усиливает позицию о необходимости долгосрочного планирования для российских компаний.

Подробнее →

Microsoft запускает глобальную сеть для обучения ИИ

Упоминание сервера GB200 NVL72 в дата-центре Microsoft с мощностью свыше 120 киловатт служит примером, иллюстрирующим экономические аспекты внедрения ИИ-оборудования. Это поддерживает аргумент о том, что высокая производительность сопряжена с ростом энергозатрат и инвестиций в инфраструктуру.

Подробнее →

Nvidia ускоряет HBM4: Samsung, SK hynix и Micron пересматривают планы

Упоминание HBM4 и её параметров (пропускная способность более 2,6 ТБ/с, скорость 13 Гбит/с на контакт) используется для подтверждения тезиса о том, что HBM4 становится ключевым элементом для ИИ-ускорителей. Это подчеркивает зависимость NVIDIA и других игроков от развития стандартов памяти.

Подробнее →