Использование моделей искусственного интеллекта в режиме инференса

Использование моделей искусственного интеллекта в режиме инференса в новостной повестке, календарь упоминаний и aналитика в реальном времени.

Календарь упоминаний:

2025

20 октября

Снижение потребности в GPU на 82% через оптимизацию инференса

Система Aegaeon Alibaba Cloud повышает эффективность использования GPU во время инференса, виртуализируя доступ к ним на уровне токенов. Это позволяет одному чипу Nvidia H20 обслуживать несколько моделей, увеличивая пропускную способность в 9 раз. В тестах количество необходимых GPU для поддержки десятков моделей сократилось с 1192 до 213. Решение особенно актуально для регионов с ограниченным доступом к новым чипам, таких как Китай, где США наложили ограничения на поставки.

Подробнее →

Использование моделей искусственного интеллекта в режиме инференса имеет 1 запись событий в нашей базе. Объединили похожие карточки: Использование моделей искусственного интеллекта в режиме инференса; Вывод с использованием моделей искусственного интеллекта; Применение моделей ИИ в задачах инференса и другие.

Китай захватывает открытый ИИ, а память дорожает: как два кризиса рушат западную модель бизнеса

Тренды

Искусственный интеллект и эрозия карьерной лестницы: как автоматизация блокирует путь новым специалистам

Тренды

Уязвимость ИИ как системный риск: новые угрозы критической инфраструктуре

Тренды