Китайские компании по ИИ переходят на подержанные видеокарты Nvidia
Китайские компании, занимающиеся искусственным интеллектом, перешли на использование подержанных видеокарт Nvidia A100 и H100 из-за ограничений на поставки новых чипов H20. Это решение обусловлено тем, что вычислительная мощность, необходимая для вывода моделей ИИ, ниже, чем для обучения, а старые модели Nvidia по-прежнему эффективны для таких задач. В результате, рынок переработанных графических процессоров Nvidia продолжает развиваться в Китае, несмотря на политические и технологические ограничения.
Вследствие новых ограничений на поставки чипов H20, китайские компании ищут альтернативы для своих проектов в области ИИ.
Nvidia разработала H20, урезанную версию процессора Hopper, специально для соответствия ограничениям экспорта США. Однако после возобновления поставок H20 в июле, китайские регуляторы выразили опасения по поводу безопасности данных и фактически запретили покупку чипа.
Популярность устаревших моделей A100 и H100
Это привело к росту спроса на более старые модели A100 и H100. Компании разбирают и перенастраивают эти видеокарты, создавая «недорогие, высокопроизводительные» системы для вывода.
Преимущества использования подержанных видеокарт
Вычислительная мощность, необходимая для вывода (inference), ниже, чем для обучения моделей ИИ. Моделям не требуется полная точность с плавающей запятой, и рабочие нагрузки могут эффективно работать на оборудовании, которое было урезано или перенастроено. Поэтому даже A100, выпущенный в 2020 году, остается ценным в некоторых сценариях использования.
A100, построенный на архитектуре Ampere от Nvidia, оснащен до 80 ГБ памяти HBM2 и пропускной способностью 2 тб/с. Хотя ему не хватает пиковой производительности Hopper, он по-прежнему очень эффективен для задач вывода, благодаря большому объему памяти и зрелой экосистеме программного обеспечения CUDA. Для таких задач, как чат-боты и системы рекомендаций, разработчики могут достичь экономичных результатов без использования передовых чипов.
H100, выпущенный в 2022 году, значительно повышает производительность благодаря памяти HBM3 и до шестикратной производительности обучения ИИ по сравнению с A100. В свою очередь, H20 был настроен для вывода, но настолько урезан, что обеспечивает от трех до почти семи раз меньшую производительность ИИ, чем полный H100, и более чем в тридцать раз медленнее при выполнении задач с двойной точностью. На практике это делает даже переоборудованные A100 более привлекательным вариантом для китайских покупателей, чем новый H20.
Поскольку экосистема CUDA от Nvidia по-прежнему остаётся безусловным лидером, старые карты остаются простыми в использовании для разработчиков. А так как оборудование для вывода может работать круглосуточно с меньшим риском потери точности, центры обработки данных Китая, очевидно, готовы платить за восстановленные платы, даже если надежность снижается.
Сложная ситуация для Nvidia
Такая ситуация ставит Nvidia в затруднительное положение. Компания понесла убытки в размере 5,5 миллиарда долларов на нераспроданных запасах H20, когда Вашингтон ввел требования к лицензированию их экспорта в Китай. Тем не менее, парадоксальным образом, чипы Nvidia остаются катализатором продолжающегося бума ИИ в Китае. Это двусторонний меч для Nvidia: ее чипы по-прежнему доминируют.
Серый рынок также представляет огромную проблему для Пекина, который стремится к развитию своих собственных конкурирующих компаний, таких как Huawei и Biren. Каждая восстановленная H100, установленная в китайском центре обработки данных, — это еще одна система, не работающая на ускорителях Ascend, что может замедлить внутренние инвестиции.
В конечном итоге, поток переработанных графических процессоров иллюстрирует непреднамеренные последствия ужесточения экспортного контроля. Американские политики надеялись ограничить доступ Китая к передовым вычислительным мощностям, в то время как Пекин стремился ускорить внедрение отечественных чипов. Вместо этого результатом стала экономика вторичного использования, где вчерашние A100 и H100 продолжают питать проекты ИИ будущего.
Пока что промышленность искусственного интеллекта Китая продлевает срок службы старого оборудования Nvidia.
Китайская промышленность искусственного интеллекта оказалась в непростой ситуации из-за ограничений на поставки передовых чипов Nvidia. Вместо того, чтобы отказаться от своих амбициозных проектов, китайские компании нашли неожиданное решение — переоборудование и использование подержанных видеокарт A100 и H100.
Это решение, хотя и вынужденное, демонстрирует прагматизм и изобретательность китайских разработчиков**.
Компании по ИИ понимают, что вычислительная мощность, необходимая для вывода (inference), не требует такой высокой производительности, как обучение моделей ИИ. Поэтому даже устаревшие модели Nvidia остаются ценными инструментами.
Ограничения на экспорт, направленные на замедление развития китайской индустрии ИИ, фактически приводят к появлению вторичного рынка, где старые технологии продолжают играть важную роль.
В долгосрочной перспективе, этот сценарий может иметь несколько возможных исходов.
- Китайские компании могут использовать это время для развития собственных технологий, чтобы в будущем стать менее зависимыми от Nvidia.
- Nvidia может адаптировать свою стратегию, найдя способы продавать свои чипы на китайском рынке, не нарушая санкций.
- Может возникнуть новый баланс сил, где американские и китайские компании будут конкурировать на равных, предлагая инновационные решения в области ИИ.
история с подержанными видеокартами Nvidia ярко демонстрирует, как политические решения могут оказывать неожиданное влияние на технологический прогресс.