Октябрь 2025 | Обзор события | 9

Alibaba Cloud: Aegaeon сокращает потребность в GPU Nvidia на 82% в условиях ограничений

Alibaba Cloud представила систему Aegaeon, сокращающую потребность в GPU Nvidia на 82% при тестировании в Model Studio. Система виртуализирует доступ к GPU на уровне токенов, позволяя одному чипу обслуживать несколько моделей и увеличивая пропускную способность в 9 раз по сравнению с предыдущими решениями.

Содержание

Обзор

Технические особенности Aegaeon

Контекст и ограничения

Как Alibaba Cloud меняет правила игры в инференсе LLM
- Стратегия в условиях ограничений
- Технологические последствия для рынка
- Долгосрочные перспективы
- Новые вызовы и возможности
- Перспективы для рынка

ИСХОДНЫЙ НАРРАТИВ

По данным, представленным на 2025 ACM Symposium on Operating Systems (SOSP) в Сеуле, Alibaba Cloud представила систему Aegaeon, сокращающую потребность в графических процессорах Nvidia на 82% при тестировании в рамках платформы Model Studio. Результаты, полученные в ходе многомесячного бета-теста, демонстрируют, что облачные провайдеры могут значительно увеличить пропускную способность существующих GPU, особенно в регионах с ограниченным доступом к новым чипам, таких как Китай.

Технические особенности Aegaeon

Система не направлена на улучшение качества модели или скорости обучения, а оптимизирует использование GPU во время инференса. В отличие от традиционных подходов, где один ускоритель выделяется под одну модель, Aegaeon виртуализирует доступ к GPU на уровне токенов. Это позволяет распределять минимальные фрагменты задач по общему пулу ресурсов. В результате один чип Nvidia H20 способен обслуживать несколько моделей одновременно, увеличивая эффективную пропускную способность («goodput») в 9 раз по сравнению с предыдущими решениями вроде ServerlessLLM или MuxServe.

В тестах, описанных в статье, совместно подготовленной исследователями из Пекинского университета и инфраструктурного подразделения Alibaba, количество GPU, необходимых для поддержки десятков моделей (включая LLM с 72 млрд параметров), снизилось с 1192 до 213. Основные улучшения достигнуты за счет двух методов:

Упаковка нескольких моделей на одном GPU;
Динамическое распределение вычислительных ресурсов на уровне генерации токенов, а не на уровне запроса.

Контекст и ограничения

Согласно отчету, тестирование проводилось с участием Nvidia H20, одного из немногих ускорителей, доступных китайским покупателям в условиях действующих ограничений США. Хотя документ не раскрывает точные детали сетевой инфраструктуры, известно, что Alibaba использует собственную технологию eRDMA (elastic RDMA) и разрабатывает интегрированные стеки для GPU. Это подчеркивает, что эффективность Aegaeon может зависеть от оптимизированной, вертикально интегрированной среды.

Интересно: Сможет ли подобная архитектура, разработанная в условиях ограниченного доступа к западным компонентам, стать эталоном для других гиперскейлеров, сталкивающихся с ростом спроса на инференс?

АНАЛИТИЧЕСКИЙ РАЗБОР

Как Alibaba Cloud меняет правила игры в инференсе LLM

Стратегия в условиях ограничений

Alibaba Cloud продемонстрировала, как можно преодолеть барьеры доступа к западным компонентам. В условиях санкций США, ограничивающих поставки мощных GPU в Китай, компания разработала систему Aegaeon, которая позволяет использовать существующие чипы Nvidia H20 в 9 раз эффективнее. Это не просто технический трюк, а стратегический ответ на внешнеполитические ограничения.

Ключевой момент: Alibaba не пытается создать альтернативу чипам Nvidia, а максимально использует доступные ресурсы. Это позволяет сохранить конкурентоспособность на внутреннем рынке, где спрос на ИИ-модели растёт. Для других компаний, сталкивающихся с аналогичными барьерами, это может стать эталоном адаптации.

Концептуальное изображение

Технологические последствия для рынка

Система Aegaeon демонстрирует, что эффективность GPU можно масштабировать за счёт архитектурных решений, а не только за счёт увеличения производительности чипов. Это может снизить спрос на новые поколения GPU в Китае, что, в свою очередь, влияет на глобальную стратегию Nvidia. Компания, возможно, будет вынуждена адаптировать свои предложения, предлагая решения для оптимизации использования существующих ресурсов.

Важно: Эффективность Aegaeon зависит от вертикально интегрированной инфраструктуры, такой как собственная технология eRDMA Alibaba. Это создаёт барьер для других игроков, желающих внедрить аналогичные решения. Для гиперскейлеров без подобной экосистемы, например, европейских или российских, адаптация такой архитектуры потребует значительных инвестиций в разработку собственных стеков.

Долгосрочные перспективы

Если Aegaeon станет стандартом, это изменит подход к проектированию GPU. Вместо фокуса на производительность отдельного чипа, производители могут начать разрабатывать архитектуры, оптимизированные для распределённого инференса. Это особенно актуально для рынков с ограничениями на доступ к западным компонентам.

Для российского бизнеса: Подобные технологии могут быть полезны в условиях санкций, но их внедрение требует наличия собственной инфраструктуры. Российские компании, которые уже инвестировали в разработку собственных решений для ИИ, могут рассмотреть адаптацию принципов Aegaeon для повышения эффективности использования имеющихся ресурсов.

Важный нюанс: Alibaba не просто оптимизировала использование GPU, а создала модель, которая может перераспределить баланс сил на рынке ИИ.

Новые вызовы и возможности

Распространение системы Aegaeon сталкивается с новыми вызовами. Китайские таможенные власти усилили контроль над поставками чипов Nvidia H20, что может ограничить доступ к этим ресурсам даже для компаний, использующих оптимизирующие технологии [!]. При этом крупные игроки, такие как ByteDance и Alibaba, уже приостановили заказы H20, что указывает на рост давления на рынок.

Однако Alibaba не ограничивается только оптимизацией существующих решений. Компания начала испытания собственного чипа для задач ИИ, что свидетельствует о стратегии постепенного снижения зависимости от западных компонентов [!]. Это двойной подход — и оптимизация текущих ресурсов, и развитие собственных технологий — может стать ключевым фактором устойчивости в условиях санкций.

Для глобальных игроков, таких как Dell, ограничения поставок GPU Nvidia уже влияют на бизнес. Компания повысила прогнозы роста, но ключевым бутылочным горлышком остаются поставки топовых ускорителей [!]. Это подчеркивает, что даже без санкций, доступ к ресурсам Nvidia становится критическим фактором для масштабирования ИИ-инфраструктуры.

Перспективы для рынка

Растущая конкуренция между китайскими и западными производителями чипов формирует новый ландшафт. Nvidia, несмотря на сокращение доли на китайском рынке, продолжает адаптировать продукты под действующие ограничения, поставляя урезанные версии чипов [!]. Однако рост собственных китайских решений, включая чипы Huawei и Alibaba, усиливает давление на западных поставщиков.

Для компаний, столкнувшихся с аналогичными барьерами, модель Alibaba демонстрирует, что эффективность можно достичь через инновации в управлении ресурсами. Это особенно важно в условиях, когда доступ к компонентам ограничен, а спрос на ИИ-модели растёт.

Вывод: Система Aegaeon не только отвечает на текущие вызовы, но и задаёт новый стандарт для оптимизации инфраструктуры. Её успех будет зависеть от способности масштабироваться за пределами вертикально интегрированных экосистем и адаптироваться к меняющимся условиям рынка.

Контакты Асектор ✉

Коротко о главном

Как работает Aegaeon в отличие от традиционных решений?

Система виртуализирует доступ к GPU на уровне токенов, позволяя одному чипу Nvidia H20 обслуживать несколько моделей одновременно, что увеличивает пропускную способность в 9 раз по сравнению с ServerlessLLM или MuxServe.

Какие результаты показали тесты Aegaeon?

В тестах количество GPU, необходимых для поддержки десятков моделей (включая LLM с 72 млрд параметров), сократилось с 1192 до 213 за счёт упаковки моделей на одном GPU и динамического распределения ресурсов.

Почему Nvidia H20 используется в тестировании?

Чип H20 — один из немногих доступных в Китае из-за ограничений США на поставки новых GPU, что делает его критичным для облачных провайдеров в регионах с ограниченным доступом к западным компонентам.

Какие технологии влияют на эффективность Aegaeon?

Эффективность системы зависит от вертикально интегрированной среды Alibaba, включая собственную технологию eRDMA и разработанные стеки для GPU, что подчёркивает её ограниченную применимость вне оптимизированной инфраструктуры.

Инфографика событий

Открыть инфографику на весь экран

Участники и связи

Отрасли: ИТ и программное обеспечение; Искусственный интеллект (AI); Облачные технологии; Бизнес; Цифровизация и технологии; Передовые технологии

Темы: Использование виртуальных технологий для распределения вычислительных мощностей; Использование моделей искусственного интеллекта в режиме инференса; Усовершенствование работы GPU в облачных инфраструктурах;

Оценка значимости: 9 из 10

Событие касается технологического прорыва в области использования GPU, который снижает зависимость от западных компонентов, что особенно актуально для России в условиях санкций. Оно затрагивает сферы технологий, экономики и инфраструктуры, имеет долгосрочное влияние и может повлиять на глобальные тренды в облачных вычислениях, косвенно затрагивая интересы российских компаний и государственных структур.

Материалы по теме

Китай запускает масштабную проверку чипов Nvidia: задержки для IT-гигантов

Усиление контроля Китайской таможни над поставками чипов Nvidia H20 и приостановка заказов ByteDance и Alibaba подчеркивает рост давления на доступ к западным компонентам. Это усиливает актуальность системы Aegaeon как решения в условиях ограничений, демонстрируя, как санкционная политика формирует инновации в оптимизации ресурсов.

Подробнее →

Alibaba начала испытания нового чипа для ИИ

Начало испытаний собственного чипа Alibaba для ИИ иллюстрирует стратегию компании по снижению зависимости от западных технологий. Это дополняет систему Aegaeon, показывая двойной подход: оптимизация текущих ресурсов и развитие собственных решений, что критично для устойчивости в условиях санкций.

Подробнее →

Dell пересматривает прогнозы из-за спроса на серверы ИИ

Ограничения поставок топовых GPU Nvidia для Dell демонстрируют глобальную зависимость от западных компонентов, даже вне прямого воздействия санкций. Это усиливает релевантность модели Alibaba, предлагающей альтернативу через управление ресурсами, а не масштабирование железа.

Подробнее →

Nvidia борется за Китай: угроза от китайских чипов растет

Сокращение доли Nvidia на китайском рынке AI-чипов и рост собственных решений Huawei и Alibaba подтверждают тенденцию к перераспределению баланса сил. Это поддерживает аргумент о том, что Aegaeon задаёт новый стандарт, способствуя переходу от «масштабирования железа» к «интеллектуальному управлению ресурсами» в условиях технологической конкуренции.

Подробнее →