Alibaba представила мощную мультимодальную модель Qwen3-Omni
Alibaba представила мультимодельную ИИ-модель Qwen3-Omni, способную обрабатывать текст, изображения, аудио и видео, и доступную бесплатно под лицензией Apache 2.0. Модель состоит из двух компонентов — «Thinker» и «Talker», показывает результаты, сопоставимые с однофакторными моделями Qwen, и заняла первое место на 32 открытых и 22 общих бенчмарках.
По данным Alibaba, компания представила новую версию открытого источника — Qwen3-Omni, которая способна обрабатывать текст, изображения, аудио и видео. Модель доступна бесплатно под лицензией Apache 2.0, что делает её привлекательной для бизнеса. Это решение позиционируется как альтернатива решениям от OpenAI и Google.
Архитектура Qwen3-Omni включает два компонента: «Thinker» и «Talker». Первый отвечает за генерацию текста, второй — за потоковую генерацию речевых токенов, основываясь на представлениях, переданных от «Thinker». Такой подход позволяет достичь сверхнизкой задержки в потоковой передаче.
Технические показатели и сравнение с конкурентами
Аналитики отмечают, что Qwen3-Omni показала результаты, сопоставимые с однофакторными моделями из серии Qwen, и превзошла их в задачах с аудио. По данным Alibaba, модель заняла первое место на 32 открытых и 22 общих бенчмарках, обогнав закрытые модели, такие как Gemini 2.5 Pro, Seed-ASR и GPT-4o-Transcribe. Это может означать, что для бизнеса открываются возможности для улучшения распознавания речи, транскрипции и мультимодальной логики.
Открытый источник как стратегическое преимущество
Релиз Qwen3-Omni укрепляет позиции Alibaba в открытом исходном коде. Tulika Sheel, вице-президент Kadence International, отмечает, что лицензия Apache 2.0 снижает барьер для экспериментов и настраиваемых решений. Компании могут интегрировать модель в свои системы без лицензионных ограничений.
Lian Jye Su из Omdia добавляет, что Alibaba Cloud с самого начала делает свои модели открытыми. За это время было выпущено более 300 моделей, а общее количество загрузок превысило 400 миллионов. На платформе Hugging Face разработчики создали свыше 140 тысяч производных моделей на основе Qwen, что делает Alibaba Cloud привлекательным выбором для компаний, ищущих зрелые открытыe решения.
Влияние на стратегию корпоративного ИИ
Если реальные показатели Qwen3-Omni будут соответствовать тестовым, это может ускорить два ключевых сдвига в корпоративной стратегии ИИ. Tulika Sheel отмечает, что компании начнут использовать смешанные стеки моделей, комбинируя открытые и проприетарные решения. Также ожидается рост инвестиций в внутренние возможности, такие как MLOps, тонкая настройка и инфраструктура.
Lian Jye Su отмечает, что использование одной модели для обработки всех типов данных может сократить ресурсные затраты и сократить время обучения и управления несколькими специализированными системами.
| Тип модели | Количество бенчмарков | Позиция |
|---|---|---|
| Открытые | 32 | 1-е |
| Общие | 22 | 1-е |
| Закрытые | — | — |
Нужно анализировать: Как лицензирование и технические достижения Alibaba Cloud могут сформировать новую конкурентную среду в корпоративном ИИ, где открытые решения становятся стратегическим преимуществом.
Открытый исходный код — это инструмент, который позволяет быстро масштабироваться, особенно в условиях, когда корпоративные клиенты всё чаще требуют контроля над данными и решениями. Alibaba Cloud уже доказала, что её подход привлекает разработчиков: более 400 миллионов загрузок и 140 тысяч производных моделей на Hugging Face — это не просто цифры, это доказательство живой экосистемы, в которой бизнес может быстро адаптировать ИИ под свои нужды.
Qwen3-Omni представляет собой ещё один шаг в сторону унификации обработки данных. Модель, способная работать с текстом, аудио, видео и изображениями, упрощает архитектуру ИИ-систем, снижает затраты на поддержку и ускоряет внедрение. Это особенно важно для российских компаний, которые сталкиваются с ограничениями доступа к западным технологиям и ищут альтернативные решения. Alibaba Cloud становится не просто поставщиком, а стратегическим партнёром в переходе к собственному ИИ-ландшафту.
Ключевая идея: Открытый исходный код и мультимодальная архитектура Alibaba Cloud создают устойчивую экосистему, которая снижает барьеры для внедрения ИИ и ускоряет цифровую трансформацию бизнеса.
Внедрение модели в корпоративной среде может стать катализатором двух тенденций: перехода к гибридным ИИ-стекам и роста инвестиций в внутренние ИИ-инструменты. Это означает, что компании будут стремиться к более автономной разработке и адаптации моделей, что особенно актуально в условиях текущей геополитической неопределённости.
Такие модели, как Qwen3-Omni, могут стать основой для создания внутренних ИИ-платформ, где данные остаются внутри компании, а адаптация моделей — под контролем. Это снижает риски, связанные с внешними поставщиками, и открывает возможности для более гибких и локализованных решений.
Контекст и конкуренция на рынке китайского ИИ
Активность Alibaba в области открытого ИИ не происходит в вакууме. В Китае наблюдается ускорение создания альтернатив западным решениям, что связано с санкциями и ограничениями на доступ к передовым технологиям. Например, компания DeepSeek столкнулась с проблемами при запуске своей модели R2 из-за сложностей с обучением на чипах Huawei. В итоге DeepSeek пришлось использовать чипы Nvidia для обучения и только затем перейти на отечественные решения. Это привело к задержке запуска и потере позиций на рынке.
Alibaba, в свою очередь, демонстрирует более сбалансированный подход. Компания начала испытания собственного чипа для задач ИИ, что снижает её зависимость от иностранных технологий. Это особенно важно в условиях, когда США ограничивают поставки передовых процессоров китайским компаниям. Новый чип Alibaba разрабатывается на собственных производственных мощностях, что делает компанию более устойчивой к геополитическим рискам.
Кроме того, Alibaba поддерживает развитие экосистемы открытого ИИ в Китае. Например, стартап Z.ai, который представил модель GLM-4.5, получил инвестиции от Alibaba и других крупных игроков. Эта модель, обученная на 15 триллионах токенов, демонстрирует высокую производительность и доступна под лицензией MIT. Такие инициативы усиливают позиции Alibaba как ключевого игрока в формировании глобального ИИ-ландшафта.
Тренд: Открытые ИИ-модели становятся стратегическим активом для компаний, ищущих альтернативы западным решениям и стремящихся к цифровой независимости.