Август 2025   |   Статья

Qwen-Image-Edit: редактируйте фото текстом как в Photoshop

Компания Alibaba выпустила новую модель искусственного интеллекта Qwen-Image-Edit, которая позволяет редактировать изображения по текстовым командам, включая как мелкие детали, так и глобальные трансформации. Инструмент поддерживает русский и китайский языки и доступен через несколько платформ, включая API Alibaba Cloud, Hugging Face и ModelScope. На данный момент пользователи могут бесплатно редактировать изображения в рамках установленных лимитов, а разработчики обещают дальнейшее развитие возможностей модели.

Недавно исследовательская группа Qwen, входящая в Alibaba, выпустила новую модель искусственного интеллекта под названием Qwen-Image-Edit. Этот инструмент способен выполнять широкий спектр задач, похожих на те, что доступны в Adobe Photoshop, но при этом требует только текстовых команд для редактирования изображений. Модель построена на базе Qwen-Image, которая была выпущена ранее в этом месяце.

Qwen-Image-Edit расширяет возможности первоначальной модели, добавляя поддержку редактирования, включая как мелкие изменения визуальных деталей, так и более глобальные трансформации. Пользователь может загрузить изображение и ввести текстовые указания, а модель вернёт изменённый результат. Примером может служить запрос: «Поменять одежду на костюм», — и модель выполнит указание, сохранив общий стиль исходного изображения.

Доступность и платформы

Новый инструмент доступен через несколько платформ, включая Qwen Chat, Hugging Face, ModelScope, GitHub и API Alibaba Cloud. Последний вариант особенно удобен для разработчиков и крупных компаний, желающих интегрировать модель в собственные приложения и процессы. На платформе Qwen Chat, которая конкурирует с ChatGPT, пользователи могут бесплатно выполнить до восьми редактирований в течение 12 часов. Для оплаченных аккаунтов установлены более высокие лимиты.

Поддержка двух языков и технические особенности

Одной из ключевых особенностей Qwen-Image-Edit является поддержка как английского, так и китайского языков. Это позволяет точно редактировать текст на изображениях, включая сложные иероглифы. Модель использует двойное кодирование, одновременно анализируя изображение для сохранения стиля и внося изменений согласно командам пользователя. Такой подход позволяет сохранить визуальную целостность изображения, даже при значительных редактированиях.

Примеры применения

Применение Qwen-Image-Edit охватывает широкий спектр задач. Например, модель может удалять отдельные волосы с портрета или менять стиль сцены, превращая реалистичный снимок в анимацию в стиле студии Ghibli. Другой пример — изменение текста на плакатах или футболках, сохраняя при этом шрифт, размер и стилистику. Такая функция особенно полезна для дизайнеров и рекламных агентств.

Технические аспекты и доступ через API

Для тех, кто хочет использовать модель в профессиональных целях, Alibaba Cloud предоставляет API. Стоимость редактирования одного изображения составляет 0,045 доллара, а бесплатный лимит составляет 100 изображений в течение 180 дней. Услуга доступна в Сингапуре, с ограничением в пять запросов в секунду и двумя одновременными задачами на аккаунт. Работа с API требует ключа, который можно получить через Model Studio. Форматы поддерживаемых изображений включают URL и Base64, с разрешением до 4096 пикселей и размером до 10 МБ.

Перспективы и развитие

Qwen-Image-Edit демонстрирует тенденцию в области искусственного интеллекта — переход от генерации изображений к интеграции редактирования, корректировки и улучшения. Модель сочетает в себе генеративные возможности с надёжностью, необходимой для профессионального использования. Это делает её полезной как для крупных проектов, так и для личных экспериментов.

Разработчики обещают дальнейшее развитие функционала, включая улучшение качества и расширение возможностей. Такой подход может существенно снизить затраты на профессиональное визуальное создание контента, особенно в сравнении с коммерческими программами вроде Photoshop.

Таким образом, Qwen-Image-Edit — это серьёзный шаг вперёд в развитии инструментов редактирования изображений на основе искусственного интеллекта. Модель демонстрирует высокий уровень точности и функциональности, что делает её интересной как для опытных пользователей, так и для новичков.

Заключение

Qwen-Image-Edit — это модель искусственного интеллекта, созданная исследовательской группой Alibaba, которая позволяет редактировать изображения с помощью текстовых команд, обеспечивая широкий спектр возможностей, от мелких визуальных изменений до глобальных трансформаций. Модель сохраняет общий стиль исходного изображения, поддерживает оба основных языка — английский и китайский, и доступна через различные платформы, включая собственные сервисы Alibaba и сторонние.

Интеграция модели через API позволяет использовать её в профессиональных задачах, в том числе в рекламе и дизайне, с возможностью как бесплатного, так и оплачиваемого использования. Технические характеристики, включая поддержку высокого разрешения и ограничения на количество запросов, обеспечивают баланс между доступностью и производительностью. Модель отражает растущую тенденцию перехода от генерации изображений к их редактированию, что может снизить затраты на визуальное контент-производство.

Коротко о главном

Модель поддерживает английский и китайский языки

Это позволяет редактировать текст на изображениях, включая сложные иероглифы, без потери стиля и композиции. Двойное кодирование обеспечивает точное выполнение команд и сохранение визуальной целостности.

Инструмент доступен через несколько платформ и API

Пользователи могут бесплатно редактировать изображения в Qwen Chat, а разработчики — интегрировать модель через API Alibaba Cloud. Бесплатный лимит составляет 100 изображений в 180 дней, стоимость одного редактирования — 0,045 доллара.

Qwen-Image-Edit может менять стили и детали изображений

Примеры включают замену одежды, удаление волос, преобразование реалистичных снимков в анимацию. Модель сохраняет общий стиль, что важно для дизайнеров и рекламных агентств.

Работа с моделью возможна через разные форматы и разрешения

Поддерживаются изображения в форматах URL и Base64, до 4096 пикселей и размером до 10 МБ. Установлены лимиты: пять запросов в секунду и две одновременные задачи на аккаунт.

Разработчики обещают расширение функционала модели

Планируется улучшение качества и добавление новых возможностей. Это может снизить затраты на создание визуального контента и упростить работу с изображениями для широкой аудитории.

Инфографика событий

Открыть инфографику на весь экран


Участники и связи

Отрасли: ИТ и программное обеспечение; Искусственный интеллект (AI); Разработка ПО; Бизнес; Цифровизация и технологии; Развлечение и творчество; Дизайн

Материалы по теме