Усовершенствование работы GPU в облачных инфраструктурах


Усовершенствование работы GPU в облачных инфраструктурах в новостной повестке, календарь упоминаний и aналитика в реальном времени.

Календарь упоминаний:

2025
20 октября

Снижение потребности в GPU на 82% за счет оптимизации виртуализации

Система Aegaeon Alibaba Cloud виртуализирует доступ к GPU на уровне токенов, позволяя одному чипу Nvidia H20 обслуживать несколько моделей одновременно. Это увеличивает эффективную пропускную способность в 9 раз по сравнению с предыдущими решениями, сокращая необходимое количество GPU с 1192 до 213 для поддержки десятков моделей. Основной причиной такой оптимизации стало ограничение доступа к новым чипам в Китае, где Aegaeon позволяет облачным провайдерам использовать существующие GPU более эффективно. Методы включают упаковку моделей на одном GPU и динамическое распределение ресурсов на уровне генерации токенов.

Подробнее →


Усовершенствование работы GPU в облачных инфраструктурах имеет 1 запись событий в нашей базе.
Объединили похожие карточки: Усовершенствование работы GPU в облачных инфраструктурах; Оптимизация использования GPU в облачных платформах; Повышение эффективности GPU в облачных вычислениях и другие.