Сентябрь 2025   |   Обзор события   | 5

Alibaba представила мощную мультимодальную модель Qwen3-Omni

Alibaba представила мультимодельную ИИ-модель Qwen3-Omni, способную обрабатывать текст, изображения, аудио и видео, и доступную бесплатно под лицензией Apache 2.0. Модель состоит из двух компонентов — «Thinker» и «Talker», показывает результаты, сопоставимые с однофакторными моделями Qwen, и заняла первое место на 32 открытых и 22 общих бенчмарках.

ИСХОДНЫЙ НАРРАТИВ

По данным Alibaba, компания представила новую версию открытого источника — Qwen3-Omni, которая способна обрабатывать текст, изображения, аудио и видео. Модель доступна бесплатно под лицензией Apache 2.0, что делает её привлекательной для бизнеса. Это решение позиционируется как альтернатива решениям от OpenAI и Google.

Архитектура Qwen3-Omni включает два компонента: «Thinker» и «Talker». Первый отвечает за генерацию текста, второй — за потоковую генерацию речевых токенов, основываясь на представлениях, переданных от «Thinker». Такой подход позволяет достичь сверхнизкой задержки в потоковой передаче.

Технические показатели и сравнение с конкурентами

Аналитики отмечают, что Qwen3-Omni показала результаты, сопоставимые с однофакторными моделями из серии Qwen, и превзошла их в задачах с аудио. По данным Alibaba, модель заняла первое место на 32 открытых и 22 общих бенчмарках, обогнав закрытые модели, такие как Gemini 2.5 Pro, Seed-ASR и GPT-4o-Transcribe. Это может означать, что для бизнеса открываются возможности для улучшения распознавания речи, транскрипции и мультимодальной логики.

Открытый источник как стратегическое преимущество

Релиз Qwen3-Omni укрепляет позиции Alibaba в открытом исходном коде. Tulika Sheel, вице-президент Kadence International, отмечает, что лицензия Apache 2.0 снижает барьер для экспериментов и настраиваемых решений. Компании могут интегрировать модель в свои системы без лицензионных ограничений.

Lian Jye Su из Omdia добавляет, что Alibaba Cloud с самого начала делает свои модели открытыми. За это время было выпущено более 300 моделей, а общее количество загрузок превысило 400 миллионов. На платформе Hugging Face разработчики создали свыше 140 тысяч производных моделей на основе Qwen, что делает Alibaba Cloud привлекательным выбором для компаний, ищущих зрелые открытыe решения.

Влияние на стратегию корпоративного ИИ

Если реальные показатели Qwen3-Omni будут соответствовать тестовым, это может ускорить два ключевых сдвига в корпоративной стратегии ИИ. Tulika Sheel отмечает, что компании начнут использовать смешанные стеки моделей, комбинируя открытые и проприетарные решения. Также ожидается рост инвестиций в внутренние возможности, такие как MLOps, тонкая настройка и инфраструктура.

Lian Jye Su отмечает, что использование одной модели для обработки всех типов данных может сократить ресурсные затраты и сократить время обучения и управления несколькими специализированными системами.

Тип моделиКоличество бенчмарковПозиция
Открытые321-е
Общие221-е
Закрытые

Нужно анализировать: Как лицензирование и технические достижения Alibaba Cloud могут сформировать новую конкурентную среду в корпоративном ИИ, где открытые решения становятся стратегическим преимуществом.

АНАЛИТИЧЕСКИЙ РАЗБОР

Открытый исходный код — это инструмент, который позволяет быстро масштабироваться, особенно в условиях, когда корпоративные клиенты всё чаще требуют контроля над данными и решениями. Alibaba Cloud уже доказала, что её подход привлекает разработчиков: более 400 миллионов загрузок и 140 тысяч производных моделей на Hugging Face — это не просто цифры, это доказательство живой экосистемы, в которой бизнес может быстро адаптировать ИИ под свои нужды.

Qwen3-Omni представляет собой ещё один шаг в сторону унификации обработки данных. Модель, способная работать с текстом, аудио, видео и изображениями, упрощает архитектуру ИИ-систем, снижает затраты на поддержку и ускоряет внедрение. Это особенно важно для российских компаний, которые сталкиваются с ограничениями доступа к западным технологиям и ищут альтернативные решения. Alibaba Cloud становится не просто поставщиком, а стратегическим партнёром в переходе к собственному ИИ-ландшафту.

Ключевая идея: Открытый исходный код и мультимодальная архитектура Alibaba Cloud создают устойчивую экосистему, которая снижает барьеры для внедрения ИИ и ускоряет цифровую трансформацию бизнеса.

Внедрение модели в корпоративной среде может стать катализатором двух тенденций: перехода к гибридным ИИ-стекам и роста инвестиций в внутренние ИИ-инструменты. Это означает, что компании будут стремиться к более автономной разработке и адаптации моделей, что особенно актуально в условиях текущей геополитической неопределённости.

Такие модели, как Qwen3-Omni, могут стать основой для создания внутренних ИИ-платформ, где данные остаются внутри компании, а адаптация моделей — под контролем. Это снижает риски, связанные с внешними поставщиками, и открывает возможности для более гибких и локализованных решений.

Контекст и конкуренция на рынке китайского ИИ

Активность Alibaba в области открытого ИИ не происходит в вакууме. В Китае наблюдается ускорение создания альтернатив западным решениям, что связано с санкциями и ограничениями на доступ к передовым технологиям. Например, компания DeepSeek столкнулась с проблемами при запуске своей модели R2 из-за сложностей с обучением на чипах Huawei. В итоге DeepSeek пришлось использовать чипы Nvidia для обучения и только затем перейти на отечественные решения. Это привело к задержке запуска и потере позиций на рынке.

Alibaba, в свою очередь, демонстрирует более сбалансированный подход. Компания начала испытания собственного чипа для задач ИИ, что снижает её зависимость от иностранных технологий. Это особенно важно в условиях, когда США ограничивают поставки передовых процессоров китайским компаниям. Новый чип Alibaba разрабатывается на собственных производственных мощностях, что делает компанию более устойчивой к геополитическим рискам.

Кроме того, Alibaba поддерживает развитие экосистемы открытого ИИ в Китае. Например, стартап Z.ai, который представил модель GLM-4.5, получил инвестиции от Alibaba и других крупных игроков. Эта модель, обученная на 15 триллионах токенов, демонстрирует высокую производительность и доступна под лицензией MIT. Такие инициативы усиливают позиции Alibaba как ключевого игрока в формировании глобального ИИ-ландшафта.

Тренд: Открытые ИИ-модели становятся стратегическим активом для компаний, ищущих альтернативы западным решениям и стремящихся к цифровой независимости.

Коротко о главном

Qwen3-Omni заняла первое место на 32 открытых и 22 общих бенчмарках

По данным Alibaba, модель превзошла закрытые решения, такие как Gemini 2.5 Pro, Seed-ASR и GPT-4o-Transcribe, особенно в задачах с аудио. Это указывает на её высокую эффективность в мультимодальной обработке данных.

Alibaba Cloud выпустила более 300 моделей с общим числом загрузок свыше 400 млн

Открытый исходный код и лицензия Apache 2.0 способствовали широкому распространению решений Alibaba. На платформе Hugging Face было создано более 140 тыс. производных моделей на основе Qwen.

Использование Qwen3-Omni может сократить затраты и время на управление несколькими системами

Модель позволяет обрабатывать все типы данных с помощью одного решения, что упрощает интеграцию и сокращает необходимость в специализированных моделях. Это ускоряет внедрение ИИ в корпоративных системах.

Alibaba позиционирует модель как инструмент для развития смешанных стеков ИИ

Эксперты отмечают, что Qwen3-Omni может стимулировать рост инвестиций в MLOps, тонкую настройку и внутренние ИИ-инфраструктуры. Это способствует переходу компаний к гибридным решениям на основе открытых моделей.

Инфографика событий

Открыть инфографику на весь экран


Участники и связи

Отрасли: ИТ и программное обеспечение; Искусственный интеллект (AI); Кибербезопасность; Бизнес; Цифровизация и технологии

Оценка значимости: 5 из 10

Событие связано с выпуском новой мультимодальной ИИ-модели Alibaba, что представляет интерес для российских компаний, использующих открытое ПО. Однако, оно имеет ограниченный масштаб аудитории за пределами специализированных технических кругов, воздействие краткосрочное и сосредоточено в одной сфере — технологиях. Лицензия Apache 2.0 и технические показатели могут быть полезны для бизнеса, но влияние на общество в целом минимально.

Материалы по теме