Qwen-Image-Edit: редактируйте фото текстом как в Photoshop
Компания Alibaba выпустила новую модель искусственного интеллекта Qwen-Image-Edit, которая позволяет редактировать изображения по текстовым командам, включая как мелкие детали, так и глобальные трансформации. Инструмент поддерживает русский и китайский языки и доступен через несколько платформ, включая API Alibaba Cloud, Hugging Face и ModelScope. На данный момент пользователи могут бесплатно редактировать изображения в рамках установленных лимитов, а разработчики обещают дальнейшее развитие возможностей модели.
Недавно исследовательская группа Qwen, входящая в Alibaba, выпустила новую модель искусственного интеллекта под названием Qwen-Image-Edit. Этот инструмент способен выполнять широкий спектр задач, похожих на те, что доступны в Adobe Photoshop, но при этом требует только текстовых команд для редактирования изображений. Модель построена на базе Qwen-Image, которая была выпущена ранее в этом месяце.
Qwen-Image-Edit расширяет возможности первоначальной модели, добавляя поддержку редактирования, включая как мелкие изменения визуальных деталей, так и более глобальные трансформации. Пользователь может загрузить изображение и ввести текстовые указания, а модель вернёт изменённый результат. Примером может служить запрос: «Поменять одежду на костюм», — и модель выполнит указание, сохранив общий стиль исходного изображения.
Доступность и платформы
Новый инструмент доступен через несколько платформ, включая Qwen Chat, Hugging Face, ModelScope, GitHub и API Alibaba Cloud. Последний вариант особенно удобен для разработчиков и крупных компаний, желающих интегрировать модель в собственные приложения и процессы. На платформе Qwen Chat, которая конкурирует с ChatGPT, пользователи могут бесплатно выполнить до восьми редактирований в течение 12 часов. Для оплаченных аккаунтов установлены более высокие лимиты.
Поддержка двух языков и технические особенности
Одной из ключевых особенностей Qwen-Image-Edit является поддержка как английского, так и китайского языков. Это позволяет точно редактировать текст на изображениях, включая сложные иероглифы. Модель использует двойное кодирование, одновременно анализируя изображение для сохранения стиля и внося изменений согласно командам пользователя. Такой подход позволяет сохранить визуальную целостность изображения, даже при значительных редактированиях.
Примеры применения
Применение Qwen-Image-Edit охватывает широкий спектр задач. Например, модель может удалять отдельные волосы с портрета или менять стиль сцены, превращая реалистичный снимок в анимацию в стиле студии Ghibli. Другой пример — изменение текста на плакатах или футболках, сохраняя при этом шрифт, размер и стилистику. Такая функция особенно полезна для дизайнеров и рекламных агентств.
Технические аспекты и доступ через API
Для тех, кто хочет использовать модель в профессиональных целях, Alibaba Cloud предоставляет API. Стоимость редактирования одного изображения составляет 0,045 доллара, а бесплатный лимит составляет 100 изображений в течение 180 дней. Услуга доступна в Сингапуре, с ограничением в пять запросов в секунду и двумя одновременными задачами на аккаунт. Работа с API требует ключа, который можно получить через Model Studio. Форматы поддерживаемых изображений включают URL и Base64, с разрешением до 4096 пикселей и размером до 10 МБ.
Перспективы и развитие
Qwen-Image-Edit демонстрирует тенденцию в области искусственного интеллекта — переход от генерации изображений к интеграции редактирования, корректировки и улучшения. Модель сочетает в себе генеративные возможности с надёжностью, необходимой для профессионального использования. Это делает её полезной как для крупных проектов, так и для личных экспериментов.
Разработчики обещают дальнейшее развитие функционала, включая улучшение качества и расширение возможностей. Такой подход может существенно снизить затраты на профессиональное визуальное создание контента, особенно в сравнении с коммерческими программами вроде Photoshop.
Таким образом, Qwen-Image-Edit — это серьёзный шаг вперёд в развитии инструментов редактирования изображений на основе искусственного интеллекта. Модель демонстрирует высокий уровень точности и функциональности, что делает её интересной как для опытных пользователей, так и для новичков.
Заключение
Qwen-Image-Edit — это модель искусственного интеллекта, созданная исследовательской группой Alibaba, которая позволяет редактировать изображения с помощью текстовых команд, обеспечивая широкий спектр возможностей, от мелких визуальных изменений до глобальных трансформаций. Модель сохраняет общий стиль исходного изображения, поддерживает оба основных языка — английский и китайский, и доступна через различные платформы, включая собственные сервисы Alibaba и сторонние.
Интеграция модели через API позволяет использовать её в профессиональных задачах, в том числе в рекламе и дизайне, с возможностью как бесплатного, так и оплачиваемого использования. Технические характеристики, включая поддержку высокого разрешения и ограничения на количество запросов, обеспечивают баланс между доступностью и производительностью. Модель отражает растущую тенденцию перехода от генерации изображений к их редактированию, что может снизить затраты на визуальное контент-производство.