Сбер открыл доступ к мощным моделям ИИ: видео по тексту и точный анализ данных
«Сбер» представил две модели искусственного интеллекта — Kandinsky Video Lite для генерации видеороликов по тексту и Giga-Embeddings для обработки текста, — доступные на условиях открытой лицензии. Kandinsky Video Lite, адаптированная под российскую культуру, превосходит по эффективности крупные аналоги, а Giga-Embeddings заняла первое место в рейтинге на русском языке, демонстрируя высокую точность векторного представления текста.
По данным, опубликованным в недавнем заявлении, «Сбер» предоставил общественному доступу две собственные модели искусственного интеллекта — Kandinsky Video Lite и Giga-Embeddings. Обе модели доступны на условиях открытой лицензии, что позволяет их использовать в коммерческих целях без ограничений.
Kandinsky Video Lite: видео по тексту с учетом культурных особенностей
Модель Kandinsky Video Lite предназначена для генерации коротких видеороликов (до 10 секунд) на основе текстовых запросов. Это компактная модель с 2 миллиардами параметров, которая, несмотря на меньший объем, демонстрирует высокое качество по сравнению с более крупными аналогами, такими как Wan 2.1 14B и Wan 2.2 5B. Внутренние тесты показали, что Kandinsky Video Lite превосходит по общей оценке, включая визуальное качество и динамику, такие модели, как Sora и Wan 2.2 A14B, которая в 13–14 раз больше.
Особое внимание в процессе обучения уделено адаптации модели к отечественным культурным особенностям. Для этого был подготовлен датасет из более чем миллиона изображений и видео, значительная часть которых отбиралась экспертами — художниками и дизайнерами. Это позволило модели лучше понимать объекты и сюжеты, характерные для российской культуры.
Кроме базовой версии, разработчики выпустили ускоренную версию Kandinsky Video Lite Flash, которая работает в 6 раз быстрее. Это делает модель особенно привлекательной для исследований и коммерческих проектов.
Giga-Embeddings: высокоточная модель для обработки текста
Вторая модель — Giga-Embeddings — предназначена для преобразования текста в векторные представления, что важно для построения RAG-систем. Модель стала лидером на русском языке, заняв первое место в рейтинге ruMTEB с результатом 74.1. Она также демонстрирует высокую эффективность и на английском языке, оставаясь конкурентоспособной на международном уровне.
Giga-Embeddings позволяет повысить точность и надежность ответов ИИ-систем, что особенно важно для корпоративных пользователей. Модель обеспечивает эффективный поиск по документам, анализ данных и автоматизированную поддержку клиентов. Разработчики могут использовать Giga-Embeddings для создания умных чат-ботов и помощников, работающих с актуальной информацией.
Роль в развитии open-source и технологий NLP
Открытие доступа к этим моделям — важный шаг в развитии open-source-сообщества и технологий обработки естественного языка. По мнению представителей «Сбера», это способствует ускорению исследований, созданию инновационных продуктов и укреплению позиций России в мировом технологическом пространстве.
Модели уже доступны на популярных платформах для разработчиков. Это делает их инструментами, которые могут быть использованы как крупными, так и небольшими компаниями, а также исследовательскими группами.
Интересно: Какое влияние окажут новые модели «Сбера» на рынок генеративного ИИ и развитие российских технологий в этой сфере?
Открытый ИИ от «Сбера»: шаг к технологической независимости или маркетинговый ход?
Когда ИИ становится инструментом, а не монополией
«Сбер» сделал публично доступными две модели искусственного интеллекта — Kandinsky Video Lite и Giga-Embeddings — с открытыми лицензиями. Это событие не просто техническое достижение, а стратегический шаг, который может изменить экосистему российского ИИ. Особенно важно, что речь идет не о закрытых инструментах для внутреннего потребления, а о полноценных продуктах, готовых к коммерческому применению.
Kandinsky Video Lite, в частности, демонстрирует, что компактные модели могут конкурировать с крупными аналогами. Это снижает порог входа для малого бизнеса и стартапов, которым ранее было невозможно работать с генеративным ИИ из-за высоких требований к ресурсам. В условиях санкций и ограничений на доступ к западным технологиям, такой шаг может стать катализатором локальной инновационной активности.
Скрытые выгоды и долгосрочные цели
К чему это ведет? Открытый доступ к ИИ-моделям — это не только маркетинговый ход, но и стратегия построения экосистемы, где «Сбер» будет центральным игроком. Делая модели доступными, компания одновременно:
- Создает зависимость от своих данных и форматов;
- Укрепляет позиции в NLP-сегменте, где российские решения пока отстают;
- Привлекает разработчиков, которые, работая с открытыми инструментами, становятся частью более широкой экосистемы, где «Сбер» — ключевой поставщик.
Кроме того, упор на российские культурные особенности в Kandinsky Video Lite говорит о стремлении к локализации ИИ-продуктов. Это не только улучшает пользовательский опыт, но и снижает риски, связанные с использованием иностранных датасетов, где могут быть скрыты предвзятости или ограничения.
Российский бизнес: возможности и вызовы
Для российского бизнеса, особенно малого и среднего, открытие таких моделей может стать настоящим прорывом. Возможность создавать видеоконтент, автоматизировать поддержку клиентов, улучшать поиск по данным — это реальные экономические выгоды. Однако есть и скрытые риски:
- Зависимость от «Сбера» может сформироваться не только в техническом, но и в организационном смысле — компании могут начать строить продукты исключительно на базе этих моделей;
- Конкуренция между банком и частным сектором может усилиться, особенно если «Сбер» будет использовать свои модели для усиления своих сервисов;
- Отсутствие регулирования в области ИИ оставляет пространство для неожиданных последствий, включая этические и юридические.
Российская ИТ-экосистема в условиях стратегических инициатив
Важно учитывать, что «Сбер» не первый раз вовлечен в инициативы, направленные на развитие цифровой экономики. Например, компания активно участвует в предложениях по расширению отсрочек от призыва для ИТ-специалистов, что говорит о стремлении сохранить в стране квалифицированные кадры. Это указывает на системный подход к формированию экосистемы, где ИИ — лишь один из элементов.
Кроме того, данные из недавних исследований показывают, что 90% разработчиков уже используют ИИ в своей работе, но доверие к этим инструментам остается низким — менее 5% разработчиков выражают высокую степень доверия. Это подчеркивает важность не только доступности ИИ-моделей, но и их надежности, прозрачности и адаптации к локальным условиям.
В контексте этих данных, шаги «Сбера» могут способствовать не только технологической независимости, но и созданию условий для роста доверия к отечественным ИИ-решениям. При этом стоит учитывать, что более 70% российских компаний, внедривших ИИ, пока не окупили инвестиции, что говорит о необходимости системного подхода к внедрению технологий, а не просто их упрощенного применения.
Обратите внимание: Открытый ИИ может стать основой для нового поколения российских стартапов, но только если бизнес будет осознанно использовать эти инструменты, а не становиться их пленником.
Источник: CNews