Китай создал ИИ-модель на отечественной технике без западных чипов
Компания Zhipu AI обучила генеративную модель изображений GLM-Image исключительно на отечественной технике Huawei, используя фреймворк MindSpore. Модель показала высокую точность в тестах и доступна через API, что делает её привлекательной для коммерческого применения.
Компания Zhipu AI продемонстрировала возможность создания конкурентоспособных ИИ-моделей на отечественной технике
По данным Computerworld, компания Zhipu AI (Цзюпу Ай И) из Китая провела полное обучение модели генерации изображений исключительно на процессорах Huawei. Это событие стало важным шагом в развитии локальной ИИ-инфраструктуры, поскольку подтверждает, что китайские компании способны создавать современные ИИ-системы без использования западных чипов.
Модель GLM-Image, выпущенная 22 января, стала первой в Китае, которая прошла полный цикл обучения на отечественной технике. Обучение осуществлялось на устройствах Huawei Ascend Atlas 800T A2 с использованием фреймворка MindSpore. Весь процесс, от предварительной обработки данных до масштабного обучения, прошёл без привлечения западных компонентов.
Стратегическое значение для Zhipu AI
В прошлом году Zhipu AI попала в список субъектов, действующих вопреки интересам США, что ограничило доступ компании к чипам NVIDIA H100 и A100, обычно используемым для обучения передовых ИИ-моделей. Это вынудило китайские разработчики искать альтернативы на базе собственных процессоров. В результате компания начала сотрудничать с Huawei, что позволило создать GLM-Image.
Успех обучения модели на Ascend-процессорах показывает, что китайские компании могут справляться с задачами высокой сложности, несмотря на ограничения. В заявлении Zhipu AI говорится, что это подтверждает «возможность обучения высокопроизводительных мультимодальных генеративных моделей на полностью отечественной вычислительной платформе».
Коммерческие параметры модели
Модель доступна через API по цене 0,1 юаня (примерно $0,014) за одно изображение. Вес модели были опубликованы на платформах GitHub, Hugging Face и ModelScope Community, что позволяет пользователям развертывать её независимо. Такой подход делает GLM-Image привлекательным решением для компаний, которым требуется создавать визуальный контент в больших объёмах — презентации, рекламные материалы и информационные графики.
В техническом отчёте Zhipu AI говорится, что GLM-Image использует гибридную архитектуру: автокодировщик на 9 млрд параметров и декодер диффузионного типа на 7 млрд параметров. Первый компонент отвечает за понимание инструкций и композицию изображения, второй — за детализацию и точное отображение текста.
Эта структура позволяет модели эффективно справляться с задачами, требующими как семантического понимания, так и точного отображения текста, например, с презентациями, информ графиками и рекламными постерами.
На бенчмарке CVTG-2K, измеряющем точность размещения текста в разных частях изображения, GLM-Image показала результат 0,9116 по метрике Word Accuracy, заняв первое место среди открытых моделей. Также модель лидировала в тесте LongText-Bench, получив 0,952 для английского и 0,979 для китайского языков в восьми сценариях, включая вывески, постеры и диалоговые окна.
Модель поддерживает несколько разрешений — от 1024×1024 до 2048×2048 пикселей — без необходимости дополнительного обучения.
Оптимизация под китайскую аппаратуру
Для обучения GLM-Image на Ascend-процессорах Zhipu AI разработала собственные оптимизационные методы. Компания создала тренировочный пакет, реализующий динамическую графовую многоуровневую трубопроводную развертку, что позволило синхронизировать разные этапы обучения и снизить узкие места.
Кроме того, Zhipu разработала высокопроизводительные операторы, совместимые с архитектурой Ascend, и применила многоструйную параллельность для перекрытия операций связи и вычисления во время распределённого обучения. Эти меры направлены на максимальное использование возможностей отечественной техники, которая работает иначе, чем чипы NVIDIA, на которых ориентированы большинство фреймворков.
Хотя технический подход подтверждает возможность создания конкурентоспособных моделей на отечественной ИИ-инфраструктуре, неизвестны затраты времени и ресурсов, понесённые при этом.
Влияние на глобальную ИИ-индустрию
Для международных компаний, работающих в Китае, появление GLM-Image, обученной на отечественной технике, может служить сигналом к пересмотру стратегий. Решения, основанные на платформах вроде Huawei Ascend и фреймворках вроде MindSpore, могут стать частью будущих разработок.
В Китае наблюдается рост инвестиций в альтернативные ИИ-инфраструктуры. Вопрос о том, будут ли санкции и экспортные ограничения замедлять или ускорять развитие параллельных экосистем, остаётся предметом дискуссий.
Ключевые факты в таблице:
| Параметр | Значение |
|---|---|
| Название модели | GLM-Image |
| Архитектура | Гибридная: автокодировщик (9 млрд параметров) + диффузионный декодер (7 млрд параметров) |
| Платформа обучения | Huawei Ascend Atlas 800T A2 |
| Фреймворк | MindSpore |
| Точность (CVTG-2K) | 0,9116 (Word Accuracy) |
| Точность (LongText-Bench) | 0,952 (английский), 0,979 (китайский) |
| Поддерживаемые разрешения | 1024×1024, 2048×2048 |
| Цена за изображение | 0,1 юаня ($0,014) |
Китайская ИИ-самостоятельность: когда ограничения становятся драйвером
Когда внешние санкции ограничивают доступ к ключевым технологическим компонентам, компании либо теряют конкурентоспособность, либо ищут новые пути. В случае Zhipu AI, китайской компании, занимающейся ИИ, путь был выбран не в сторону сдачи, а в сторону ускоренного развития собственной ИИ-инфраструктуры. Результатом стал выход модели GLM-Image — первой в Китае, полностью обученной на отечественных процессорах Huawei. Это событие не только подтверждает технологическую зрелость локальной ИИ-экосистемы, но и открывает важные уроки для российского бизнеса, сталкивающегося с похожими вызовами.
Когда блокада становится стимулом
В 2023 году Zhipu AI попала в список субъектов, действующих вопреки интересам США. Это ограничило доступ компании к чипам NVIDIA H100 и A100, которые, как правило, используются для обучения крупных ИИ-моделей. Вместо того чтобы прекратить развитие, компания начала сотрудничать с Huawei и построила GLM-Image на процессорах Ascend Atlas 800T A2.
Это решение потребовало значительной адаптации. Большинство современных ИИ-фреймворков оптимизированы под архитектуру NVIDIA, и перенос обучения на китайские чипы потребовал разработки собственных методов оптимизации. Zhipu AI создала динамическую графовую систему, которая позволила синхронизировать этапы обучения, а также разработала высокопроизводительные операторы, совместимые с Ascend. Эти меры помогли компании не только справиться с задачей, но и добиться высоких результатов на тестах.
Неожиданное преимущество: Ограничения, на первый взгляд, ограничивают возможности, но зачастую вынуждают компании пересмотреть подходы и создавать решения, которые ранее не рассматривались как жизнеспособные [!].

Экосистема vs. индивидуальные усилия
Успех Zhipu AI — это не просто победа одной компании, а индикатор более масштабной тенденции. В Китае наблюдается рост инвестиций в альтернативные ИИ-инфраструктуры. Это связано с тем, что глобальные санкции и ограничения на доступ к западным компонентам заставляют страны, такие как Китай, создавать собственные экосистемы, включая чипы, фреймворки и даже облака.
Для российского бизнеса этот пример особенно важен. Если аналогичные ограничения распространятся на ИИ-сектор, компании, не подготовленные к таким сценариям, столкнутся с серьёзными трудностями. Зависимость от иностранных технологий может привести к остановке разработок, утрате конкурентоспособности и потере рынков.
Скрытая опасность: Зависимость от иностранных компонентов может быть неочевидной, но её последствия — прямые и значительные. Компании, не готовые к смене экосистем, рискуют остаться без ключевых ресурсов в критический момент [!].
Перспективы и уроки для будущего
GLM-Image — это не просто ещё одна ИИ-модель. Это сигнал о том, что локальная ИИ-инфраструктура может быть не только жизнеспособной, но и конкурентоспособной. Для российских компаний, которые сейчас активно внедряют ИИ, этот опыт показывает, что важно не только следить за трендами, но и задумываться о стратегической независимости.
Развитие собственных ИИ-платформ требует времени, инвестиций и междисциплинарного подхода. Однако, как показывает пример Zhipu AI, это не невозможно. В условиях глобальной нестабильности и технологических ограничений, способность создавать решения на локальной основе становится не просто преимуществом, а необходимостью.
Важный нюанс: GLM-Image — часть национальной стратегии Китая по созданию независимой ИИ-инфраструктуры, которая может стать основой для будущих инноваций даже в условиях санкций [!].
Технические достижения и их значение
Модель GLM-Image использует гибридную архитектуру: автокодировщик на 9 млрд параметров и диффузионный декодер на 7 млрд параметров. Это позволяет модели эффективно справляться с задачами, требующими как семантического понимания, так и точного отображения текста, например, с презентациями, информ графиками и рекламными постерами.
На бенчмарке CVTG-2K, измеряющем точность размещения текста в разных частях изображения, GLM-Image показала результат 0,9116 по метрике Word Accuracy, заняв первое место среди открытых моделей. Также модель лидировала в тесте LongText-Bench, получив 0,952 для английского и 0,979 для китайского языков в восьми сценариях, включая вывески, постеры и диалоговые окна.
Важный нюанс: Технические показатели GLM-Image подтверждают, что локальная ИИ-инфраструктура способна конкурировать с западными решениями [!].
Коммерческая реализация и доступность
Модель доступна через API по цене 0,1 юаня (примерно $0,014) за одно изображение. Вес модели были опубликован на платформах GitHub, Hugging Face и ModelScope Community, что позволяет пользователям развертывать её независимо. Такой подход делает GLM-Image привлекательным решением для компаний, которым требуется создавать визуальный контент в больших объёмах — презентации, рекламные материалы и информационные графики.
Важный нюанс: Открытая доступность и низкая стоимость использования модели GLM-Image делают её масштабно применимой в коммерческих задачах [!].
Стратегические перспективы и уроки для российского бизнеса
GLM-Image — это не просто модель, а часть национальной стратегии Китая по созданию независимой ИИ-инфраструктуры. Для российского бизнеса, сталкивающегося с аналогичными вызовами, этот опыт может стать полезным ориентиром в выборе стратегий и технологий для будущих разработок.
Важный нюанс: В условиях глобальной нестабильности и технологических ограничений, способность создавать решения на локальной основе становится не просто преимуществом, а необходимостью [!].
Источник: computerworld.com