Март 2026 | Обзор события | 5

Huawei Atlas 350: ускорение вывода ИИ-моделей в 2,8 раза без Nvidia

Новый ускоритель Huawei Atlas 350 демонстрирует производительность в задачах вывода моделей, превышающую возможности Nvidia H20 в 2,8 раза, что меняет расстановку сил на рынке ИТ-инфраструктуры. Это решение позволяет предприятиям масштабировать внедрение искусственного интеллекта с меньшими затратами и высокой скоростью обработки, снижая зависимость от глобальных цепочек поставок.

Содержание

Обзор

Смена приоритетов: от обучения к практическому применению

Технологическая независимость и экосистема

Цена компромисса: реальность за цифрами производительности
- Ловушка специализации и скрытые издержки
- Экосистема как барьер и географический обход
- Стратегические последствия для бизнеса

ИСХОДНЫЙ НАРРАТИВ

По данным издания GizmoChina, на рынке ИТ-решений появился новый ускоритель Huawei Atlas 350, ориентированный на задачи вывода моделей искусственного интеллекта. Устройство базируется на чипе Ascend 950PR и демонстрирует производительность, которая, по заявлениям производителя, превышает возможности Nvidia H20 в специфических рабочих нагрузках до 2,8 раза. Этот запуск отражает сдвиг фокуса китайской технологической индустрии: вместо разработки инфраструктуры для обучения нейросетей компании делают ставку на эффективное развертывание уже готовых моделей в реальных приложениях.

Смена приоритетов: от обучения к практическому применению

Рынок искусственного интеллекта переживает этап трансформации, когда ключевым вызовом становится не создание моделей, а их масштабное внедрение. Huawei Atlas 350 спроектирован специально для работы с рекомендательными системами, большими языковыми моделями и мультимодальными инструментами. Такой подход позволяет оптимизировать ресурсы для предприятий, где скорость обработки запросов и энергоэффективность важнее предельной точности вычислений, необходимой на этапе обучения.

Использование формата вычислений с низкой точностью FP4 обеспечивает ускорение обработки данных и снижение потребления памяти. Это критически важно для систем, работающих в режиме реального времени, где задержки недопустимы. Архитектура чипа также оптимизирована для этапа «prefill» (предварительной обработки входных данных), что ускоряет реакцию систем на запросы пользователя. Для бизнеса это означает возможность запускать более сложные ИИ-агенты без существенного увеличения затрат на аппаратное обеспечение.

Технологическая независимость и экосистема

Значимым аспектом новинки является переход к использованию собственной высокоскоростной памяти. Конфигурации чипа включают до 128 ГБ памяти с пропускной способностью 1,6 ТБ/с. Это решение снижает зависимость от внешних поставщиков компонентов и укрепляет позиции китайской полупроводниковой отрасли. Интеграция памяти непосредственно в архитектуру процессора позволяет сократить задержки и повысить общую эффективность системы.

Компания строит не просто отдельный продукт, а интегрированную ИИ-экосистему, включающую вычислительные мощности, системы хранения данных и программное обеспечение. Вертикальная интеграция дает возможность жестче контролировать качество и скорость развертывания решений на собственной инфраструктуре. Такая стратегия позволяет адаптировать технологии под специфические требования внутреннего рынка, минимизируя риски, связанные с глобальными цепочками поставок.

Влияние этих изменений на глобальный рынок трудно переоценить. Ограничения на экспорт передовых чипов из США подтолкнули китайских производителей к ускоренной разработке собственных альтернатив. Появление конкурентоспособных решений, таких как Atlas 350, меняет баланс сил: китайский рынок получает доступ к независимой инфраструктуре, а американские компании сталкиваются с усилением конкуренции в одном из крупнейших сегментов.

Параметр	Huawei Atlas 350 (Ascend 950PR)	Nvidia H20 (для сравнения)
Основное назначение	Вывод моделей (Inference)	Вывод и обучение
Производительность (FP4)	~1,56 петафлопс	Ниже (по данным Huawei)
Преимущество в скорости	До 2,8× в задачах вывода	Базовый уровень
Память	До 128 ГБ, 1,6 ТБ/с	Зависит от конфигурации
Фокус	Эффективность и скорость	Универсальность

Для конечных пользователей и бизнеса появление таких решений может привести к удешевлению и ускорению ИИ-сервисов, особенно в Китае. Локальные платформы и приложения получат доступ к мощным вычислительным ресурсам, что стимулирует создание новых продуктов. В долгосрочной перспективе это может способствовать формированию раздельных технологических контуров, где разные регионы развивают собственные экосистемы.

Ситуация требует детального анализа со стороны инвесторов и руководителей технологических компаний. Изменение структуры рынка, появление новых стандартов эффективности и сдвиги в цепочках поставок создают как новые возможности, так и риски. Понимание того, как именно новые аппаратные решения влияют на экономику ИИ-проектов, становится критически важным для принятия стратегических решений в ближайшие годы.

АНАЛИТИЧЕСКИЙ РАЗБОР

Цена компромисса: реальность за цифрами производительности

Запуск ускорителя Huawei Atlas 350 на базе чипа Ascend 950PR часто интерпретируется как триумф технологического суверенитета. Заявленная производительность, превышающая возможности Nvidia H20 в задачах вывода до 2,8 раза, звучит убедительно. Однако за этими цифрами скрывается не столько прорыв, сколько вынужденная адаптация к жестким условиям рынка. Китайские технологические гиганты не просто перестроились на новые рельсы; они вынуждены балансировать между доступностью отечественного железа и необходимостью использовать западные решения для критически важных этапов разработки.

Рынок искусственного интеллекта действительно пережил фундаментальный сдвиг: фокус сместился с обучения моделей на их массовое внедрение. Согласно прогнозам, спрос на вычислительные мощности для вывода вырос в миллионы раз, превратив доступ к чипам в ключевой элемент финансовой стратегии бизнеса [!]. В этих условиях Huawei предлагает решение, оптимизированное именно под этот этап. Устройство спроектировано для работы с рекомендательными системами и большими языковыми моделями, где скорость реакции и энергоэффективность часто важнее предельной точности вычислений, необходимой при обучении.

Однако утверждение о полном переходе на отечественную инфраструктуру требует уточнения. Реальность оказалась гибридной. Крупнейшие игроки, такие как DeepSeek, столкнулись с тем, что обучение новых сложных моделей на чипах Huawei вызывает технические трудности. Компания была вынуждена отложить запуск модели R2, так как процесс обучения на Ascend оказался нестабильным. В итоге DeepSeek использовала чипы Nvidia для обучения, а для вывода результатов переключилась на решения Huawei [!]. Этот кейс демонстрирует, что стратегия «только вывод» — это не добровольный выбор, а попытка обойти узкое место, возникшее из-за невозможности закупать топовые чипы для обучения.

Ловушка специализации и скрытые издержки

Ключевым аргументом в пользу нового чипа является поддержка вычислений с низкой точностью FP4. Это позволяет ускорить обработку данных и снизить потребление памяти, что критично для систем реального времени. Однако снижение точности — это компромисс, который имеет долгосрочные последствия. Использование FP4 вместо более точных форматов (FP16 или FP32) означает, что модель «видит» данные менее детально. В задачах, требующих высокой точности, это может привести к накоплению ошибок и деградации качества ответов.

Для бизнеса это означает необходимость тщательной валидации. Если модель, обученная на более точных данных, будет запускаться на ускорителе с низкой точностью, итоговый результат может не соответствовать ожиданиям. Экономия на памяти и энергии может обернуться потерей репутации из-за неточных ответов ИИ-агентов. Кроме того, оптимизация под этап «prefill» ускоряет реакцию на запрос, но не гарантирует качество генерации последующих токенов. В сценариях с высокой нагрузкой пользователи могут получить мгновенную реакцию, но содержание ответа будет хуже, чем ожидалось.

Компании вынуждены искать обходные пути для максимизации эффективности имеющегося оборудования. Alibaba Cloud представила систему Aegaeon, которая виртуализирует доступ к GPU на уровне токенов. Это позволяет одному чипу Nvidia H20 обслуживать несколько моделей одновременно, увеличивая пропускную способность в 9 раз и сокращая потребность в ускорителях на 82% [!]. Такой подход показывает, что китайские компании борются не только за «железо», но и за софтовую оптимизацию, чтобы выжать максимум из урезанных чипов. Это усиливает аргумент о том, что текущая стратегия строится на серии сложных компромиссов.

Важный нюанс: Успех в обучении модели на отечественной технике, как в случае с Zhipu AI и моделью GLM-Image, возможен только при полной экосистемной интеграции, включая использование фреймворка MindSpore. Для массового перехода на Huawei требуется болезненное переписывание кода, привычного к CUDA, что создает высокий барьер входа для многих разработчиков.

Концептуальное изображение

Экосистема как барьер и географический обход

Интеграция собственной высокоскоростной памяти и создание вертикально интегрированной экосистемы — это мощный инструмент формирования закрытого рынка. Huawei строит среду, где железо, память и программное обеспечение работают как единый организм. Это дает преимущества в производительности внутри контура, но создает серьезные проблемы для сторонних разработчиков. В отличие от экосистемы Nvidia, ставшей стандартом де-факто, китайская модель требует глубокой переработки кода под специфическую архитектуру Ascend.

Для компаний, работающих на глобальном рынке, это означает необходимость поддержки двух разных технологических стеков. Это удваивает затраты на разработку и тестирование. Такая стратегия ведет к фрагментации рынка ИИ. Вместо единого глобального стандарта появляются изолированные контуры, где технологии развиваются независимо друг от друга. Для инвесторов это сигнал о том, что универсальные решения теряют ценность, а локальные игроки получают преимущество за счет глубокой интеграции с заказчиками внутри своих регионов.

При этом картина «полной изоляции» неверна. Китайские компании находят способы обхода ограничений через географическое смещение инфраструктуры. ByteDance развернула в Малайзии вычислительный кластер стоимостью $2,5 млрд через местного оператора Aolani Cloud. Эта схема позволяет использовать новейшие чипы Nvidia B200 за пределами контролируемых стран, сохраняя доступ к передовым технологиям [!]. Это доказывает, что «технологический суверенитет» не означает полный отказ от западных технологий, а скорее их диверсификацию и поиск легальных путей доступа.

В то же время, Nvidia не оставляет попыток удержать позиции. Компания возобновила поставки урезанной версии чипа H20 в Китай после перерыва, несмотря на рост конкуренции со стороны Huawei [!]. Доля Nvidia на рынке китайских AI-ускорителей сокращается, но спрос на её решения остается высоким из-за эффективности в тяжелых вычислениях. Местные компании, включая Huawei, активно развивают собственные чипы, но их образцы часто содержат компоненты от TSMC, Samsung и SK Hynix, что создает регуляторные риски [!].

Стоит учесть: Вертикальная интеграция Huawei создает не просто альтернативу Nvidia, а параллельную реальность, где совместимость с глобальными стандартами становится вторичной по сравнению с эффективностью внутри замкнутого контура. Это формирует рынок, где технологический суверенитет достигается ценой потери гибкости и универсальности.

Стратегические последствия для бизнеса

В этой гонке есть очевидные победители и скрытые проигравшие. Huawei и китайские технологические гиганты получают доступ к независимой инфраструктуре, что снижает риски срыва поставок. Однако цена этой независимости — необходимость постоянного перепрофилирования алгоритмов и программного обеспечения под новые, часто менее гибкие аппаратные решения. Для малого и среднего бизнеса, не имеющего ресурсов на глубокую оптимизацию кода, переход на новую платформу может стать непреодолимым барьером.

Акцент на эффективность вывода смещает фокус с инноваций в области создания новых моделей на оптимизацию существующих. Это может замедлить прогресс в фундаментальных исследованиях, так как ресурсы направляются на решение прикладных задач. В долгосрочной перспективе это может привести к тому, что технологический разрыв трансформируется: вместо отставания в мощности появится отставание в гибкости и универсальности решений.

Рынок ИИ движется к состоянию, где технологический суверенитет становится важнее глобальной эффективности. Компании, которые смогут адаптироваться к этой новой реальности, найдут ниши для роста. Тем, кто будет полагаться на старые модели универсальности, придется пересматривать свои стратегии. Главный урок заключается в том, что в условиях ограничений эффективность часто достигается за счет компромиссов, которые не всегда очевидны на первый взгляд. Успех зависит от способности компании управлять этими компромиссами, балансируя между скоростью развертывания, качеством моделей и доступом к глобальным технологиям.

Источник: GizmoChina

Контакты Асектор ✉

Коротко о главном

Почему производитель выбрал формат вычислений FP4 для нового чипа?

Использование низкой точности FP4 ускоряет обработку данных и снижает потребление памяти, что критически важно для систем реального времени, где недопустимы задержки при работе с рекомендательными системами и языковыми моделями.

Каким образом новая архитектура памяти снижает зависимость от внешних поставщиков?

Интеграция до 128 ГБ собственной высокоскоростной памяти с пропускной способностью 1,6 ТБ/с непосредственно в процессор сокращает задержки и укрепляет технологическую независимость китайской отрасли от импорта компонентов.

Что стало основной причиной смены фокуса китайской индустрии с обучения на вывод моделей?

Экспортные ограничения США на поставку передовых чипов подтолкнули производителей к разработке альтернатив, ориентированных на эффективное применение уже существующих моделей в реальных приложениях.

Как вертикальная интеграция экосистемы Huawei влияет на скорость развертывания решений?

Объединение вычислительных мощностей, систем хранения и программного обеспечения в единую платформу позволяет жестче контролировать качество и адаптировать технологии под требования внутреннего рынка, минимизируя риски глобальных цепочек поставок.

Какой эффект появление Atlas 350 окажет на стоимость ИИ-сервисов для бизнеса?

Доступ к мощным локальным вычислительным ресурсам позволяет запускать сложные ИИ-агенты без существенного увеличения затрат на оборудование, что стимулирует создание новых продуктов и удешевление услуг.

Инфографика событий

Открыть инфографику на весь экран

Участники и связи

Отрасли: ИТ и программное обеспечение; Искусственный интеллект (AI); Бизнес; Тренды и кейсы; Управление и стратегия; Промышленность; Производство электроники; Передовые технологии

Темы: Аппаратное ускорение ИИ; Система обработки данных; Технологическая независимость;

Оценка значимости: 5 из 10

Событие представляет собой значимый технологический сдвиг в глобальной полупроводниковой отрасли, демонстрирующий рост независимости Китая от западных решений, что косвенно влияет на Россию через возможность появления альтернативных поставщиков оборудования в условиях санкций. Однако, так как выпуск продукта ориентирован преимущественно на внутренний китайский рынок и не подразумевает немедленного массового импорта или прямого изменения экономической ситуации в России, его влияние остается опосредованным и среднесрочным, затрагивая в основном технологическую и экономическую сферы без системных последствий для российского общества.

Материалы по теме

Прогноз NVIDIA на триллион долларов: инференс вытесняет обучение как главный драйвер спроса

Прогноз о миллионном росте спроса на вычислительные мощности для вывода (inference) стал фундаментом для тезиса о смене парадигмы рынка: от обучения моделей к их массовому внедрению. Эти данные обосновывают, почему Huawei фокусируется именно на оптимизации этапа вывода, превращая доступ к чипам в ключевой элемент финансовой стратегии бизнеса.

Подробнее →

Китайская DeepSeek откладывает запуск AI из-за проблем с чипами Huawei

Кейс компании DeepSeek, отложившей запуск модели R2 из-за нестабильности обучения на Ascend и вынужденной использовать Nvidia для обучения и Huawei для вывода, служит главным доказательством гибридной реальности. Этот факт развенчивает миф о полном переходе на отечественную инфраструктуру, показывая, что стратегия «только вывод» является вынужденной адаптацией к техническим ограничениям, а не добровольным выбором.

Подробнее →

Alibaba Cloud: Aegaeon сокращает потребность в GPU Nvidia на 82% в условиях ограничений

Данные о системе Aegaeon от Alibaba Cloud, которая увеличивает пропускную способность чипа Nvidia H20 в 9 раз и сокращает потребность в ускорителях на 82%, иллюстрируют стратегию софтовой оптимизации. Этот пример подтверждает, что китайские компании вынуждены искать сложные обходные пути, чтобы выжать максимум из урезанного «железа», что усиливает аргумент о цене компромиссов в текущей стратегии.

Подробнее →

Массовый запуск HBM4 Micron: снижение энергозатрат на ИИ-проекты

Информация о развертывании ByteDance вычислительного кластера стоимостью $2,5 млрд в Малайзии через Aolani Cloud для доступа к чипам Nvidia B200 опровергает тезис о полной изоляции. Этот факт демонстрирует, как компании используют географическое смещение инфраструктуры для легального обхода ограничений, доказывая, что «технологический суверенитет» на практике означает диверсификацию и поиск путей доступа к западным технологиям.

Подробнее →

Nvidia борется за Китай: угроза от китайских чипов растет

Факт возобновления Nvidia поставок урезанной версии чипа H20 в Китай после перерыва, на фоне сокращения доли компании на рынке, подчеркивает сложность конкурентной борьбы. Это подтверждает, что несмотря на рост конкуренции со стороны Huawei, спрос на западные решения остается высоким из-за их эффективности в тяжелых вычислениях, что делает картину рынка не черно-белой, а многогранной.

Подробнее →

США и Китай усиливают контроль над чипами ИИ: ограничения для Nvidia и Huawei

Упоминание того, что образцы чипов Huawei содержат компоненты от TSMC, Samsung и SK Hynix, раскрывает скрытые регуляторные риски и иллюзию полной автономии. Этот факт служит важным уточнением: даже при развитии собственных чипов, зависимость от глобальной цепочки поставок сохраняется, что создает уязвимости для стратегии технологического суверенитета.

Подробнее →

Китай создал ИИ-модель на отечественной технике без западных чипов

Успешный кейс Zhipu AI, обучившей модель GLM-Image на отечественной технике Huawei с использованием фреймворка MindSpore, используется как контраргумент, демонстрирующий возможность полной экосистемной интеграции. Однако этот пример одновременно подчеркивает высокий барьер входа: успех возможен только при болезненном переписывании кода и отказе от привычных стандартов CUDA, что ограничивает массовый переход.

Подробнее →