NVIDIA Blackwell Ultra: производительность в 1,5 раза выше в задачах с низкой латентностью
NVIDIA вывела производительность агентных ИИ-систем на новый уровень, разделив обработку запросов между узлами и сократив латентность в 58 раз — что ставит под угрозу текущий баланс сил в сфере крупномасштабных вычислений. Такой скачок эффективности меняет правила игры для облаков и гиперскейлеров, вынуждая их пересматривать стратегии масштабирования и выбора оборудования.
По данным Wccftech, компания NVIDIA провела тестирование своих систем GB300 NVL72 на базе архитектуры Blackwell Ultra с участием последних открытых моделей DeepSeek. Результаты демонстрируют значительное улучшение характеристик в задачах, где важна скорость обработки. В частности, Blackwell Ultra обеспечивает в 1,5 раза более высокую производительность по сравнению с предыдущей версией — GB200 NVL72 — в сценариях, чувствительных к латентности.
Эксперты отмечают, что NVIDIA сосредоточилась на улучшении обработки длинных контекстов, что особенно важно для агентных систем искусственного интеллекта. В рамках тестов, проведённых организацией Large Model Systems Organization (LMSYS), было применено несколько оптимизационных методов, включая PD Disaggregation — подход, позволяющий разделить обработку запросов между разными узлами, чтобы избежать узких мест.
Этот метод позволяет разделить процесс на две фазы: prefill — обработка входного запроса, и decode — генерация токенов. Такой подход увеличивает пропускную способность и делает масштабирование более эффективным. В дополнение к PD Disaggregation, были использованы динамическое разделение запросов и оптимизация ёмкости KV-кэша, что позволило добиться улучшения характеристик.
Сравнение показателей GB300 NVL72 и GB200 NVL72
Тестирование показало, что GB300 NVL72 обеспечивает значительное увеличение производительности по сравнению с предыдущей версией. Основные показатели включают:
- Пиковая пропускная способность: 226,2 токена в секунду на GPU (TPS/GPU), что в 53 раза выше, чем у предшественника.
- Скорость работы на пользовательском уровне: увеличение в 87 раз благодаря MTP (Multi-Token Prediction).
- Снижение латентности: улучшение на 58 раз.
По данным LMSYS, в среднем GB300 опережает GB200 в 1,4–1,5 раза, особенно в задачах с высокими требованиями к времени отклика. Это делает Blackwell Ultra особенно привлекательным для крупных облачных провайдеров и гиперскейлеров, где требуется высокая производительность и низкая задержка.

Оптимизация для масштабных вычислений
NVIDIA продолжает совершенствовать не только архитектуру своих чипов, но и подходы к решению промышленных задач. В случае Blackwell Ultra ключевое внимание уделено улучшению показателей латентности, что особенно важно для агентных систем искусственного интеллекта. Эксперты указывают, что такой фокус позволяет GB300 выделяться среди конкурентов и обеспечивает его популярность в крупных вычислительных системах.
Однако, несмотря на улучшение в производительности, пока не приведены данные о стоимости владения (TCO), что остаётся важным фактором при выборе оборудования для масштабных решений. Увеличение стоимости развертывания в сочетании с ростом возможностей требует тщательного анализа со стороны заказчиков.
Таблица сравнения показателей
| Показатель | GB300 NVL72 | GB200 NVL72 |
|---|---|---|
| Пиковая пропускная способность (TPS/GPU) | 226,2 | 4,26 |
| Скорость на пользовательском уровне (TPS/пользователь) | ×87 | — |
| Снижение латентности | ×58 | — |
| Среднее улучшение по сравнению с GB200 | 1,4–1,5 раза | — |
Продолжающаяся трансформация архитектуры
Разработка новых поколений оборудования демонстрирует, что NVIDIA не ограничивается улучшением отдельных компонентов, а стремится к комплексной оптимизации. Такие подходы, как PD Disaggregation и MTP, позволяют не только повысить производительность, но и адаптировать оборудование под конкретные задачи. Это особенно важно для отраслей, где требуется обработка больших объёмов данных с минимальной задержкой.
Эксперты отмечают, что с ростом сложности моделей искусственного интеллекта и увеличением объёмов данных, требования к аппаратным ресурсам становятся всё жёстче. NVIDIA, по их мнению, справляется с этим вызовом, предлагая решения, которые соответствуют современным требованиям.
Баланс между производительностью и устойчивостью: как NVIDIA меняет ИИ-инфраструктуру
Рост производительности как стратегический приоритет
NVIDIA продолжает укреплять позиции в сфере искусственного интеллекта, представив платформу Blackwell Ultra, которая демонстрирует рекордную пропускную способность 130 ТБ/с. Это стало возможным благодаря объединению 72 GPU в единую сеть NVLink. По сравнению с предыдущей архитектурой, Blackwell Ultra в 50 раз повышает энергоэффективность и сокращает стоимость обработки токенов в 35 раз. Такой рост производительности делает Blackwell ключевым элементом для гиперскейлеров и облачных провайдеров, где требуется низкая задержка и высокая пропускная способность.
Особое внимание компания уделяет оптимизации агентных систем искусственного интеллекта. Скорость обработки внимания в таких системах увеличена в 2 раза, а стоимость токена сокращена в 1,5 раза. Это позволяет Blackwell Ultra опережать аналоги в задачах, где важна точность и скорость реакции.
Инфраструктурные вызовы и зависимости
Достижение таких высоких показателей требует значительных изменений в подходах к инфраструктуре. Основной драйвер роста — стандарт HBM4, который становится де-факто новой нормой для ИИ-ускорителей. Samsung, SK hynix и Micron уже адаптируют производственные мощности, чтобы соответствовать повышенным требованиям к пропускной способности и термическим характеристикам. HBM4 обеспечивает до 3,3 ТБ/с на стек и объём памяти до 48 ГБ, что позволяет снизить трудности при работе с масштабными ИИ-моделями.
Важный нюанс: Однако рост зависимости от HBM4 и других высокотехнологичных компонентов создаёт новые риски. Например, Южная Корея столкнулась с проблемами доступа к Blackwell после заявлений президента США, ограничивающего доступ к таким технологиям только для американских клиентов. Это может задержать реализацию крупных проектов в области искусственного интеллекта, особенно в регионах, где инфраструктура ещё не полностью сформирована.
Геополитические и экономические риски
Введение ограничений на поставки Blackwell в Китай усилило конкуренцию за доступ к передовым ИИ-чипам. Китайские регуляторы рассматривают возможность ограничения доступа к этим чипам, что может снизить коммерческий потенциал NVIDIA в регионе. По оценке Джин Хуана, такие меры стимулируют Китай к ускорению разработки собственных альтернатив, что ускоряет развитие локальной полупроводниковой отрасли.
Важный нюанс: Для российских компаний важно учитывать, что глобальные регулирования и геополитические факторы могут ограничивать доступ к передовым технологиям. Это требует пересмотра стратегий закупок и логистики, а также усиления фокуса на локальных разработках и адаптации инфраструктуры под доступные решения.
Экономические аспекты: стоимость владения и масштабирование
Одним из ключевых факторов, влияющих на выбор оборудования для масштабных решений, остаётся стоимость владения (TCO). Увеличение производительности часто сопровождается ростом энергозатрат, что может стать узким местом, если инфраструктура для охлаждения и питания не обеспечена. Например, сервер GB200 NVL72 рассчитан на нагрузку свыше 120 киловатт, что требует значительных инвестиций в энергетическую систему дата-центра.
Кроме того, рост сложности архитектуры увеличивает затраты на обслуживание и обучение персонала. Это особенно чувствительно для регионов, где доступ к высококвалифицированным специалистам ограничен. Для облачных провайдеров, которым обещана высокая производительность и низкая задержка, рост стоимости владения становится критическим фактором. Даже если технические характеристики выглядят привлекательно, итоговая стоимость может быть выше, чем у менее производительных, но более экономичных решений.
Инвестиции и инфраструктурный бум
Рост капитальных вложений в ИИ превышает $100 млрд, что формирует новую инфраструктуру, меняющую природу программного обеспечения. NVIDIA отмечает, что рост инвестиций — это долгосрочный процесс, а не краткосрочный спринт. Спрос на ИИ-решения остаётся высоким из-за их новой полезности, особенно в таких секторах, как научные вычисления, медицина и финансы.
Важный нюанс: Для российского бизнеса важно не только учитывать технические характеристики, но и оценивать долгосрочные экономические последствия внедрения таких решений. Без тщательного анализа текущих систем и готовности к переходу на более сложные технологии даже самые привлекательные обещания производительности могут стать камнем преткновения.
Заключение: баланс между скоростью и устойчивостью
NVIDIA продемонстрировала, что её новая архитектура Blackwell Ultra способна достичь высоких показателей производительности. Однако для бизнеса важно не только увидеть цифры, но и понять, какие риски они несут. Увеличение сложности, рост затрат на обслуживание, зависимость от одного производителя — все это факторы, которые могут оказать обратное влияние на успех проекта.
Для российских компаний, рассматривая внедрение таких решений, особенно важно провести аудит текущих систем и оценить, насколько они готовы к переходу на более сложные и требовательные технологии. Без этого даже самые привлекательные обещания производительности могут стать камнем преткновения.
Источник: wccftech.com