Сентябрь 2025   |   Обзор события   | 7

Сбер открыл доступ к мощным моделям ИИ: видео по тексту и точный анализ данных

«Сбер» представил две модели искусственного интеллекта — Kandinsky Video Lite для генерации видеороликов по тексту и Giga-Embeddings для обработки текста, — доступные на условиях открытой лицензии. Kandinsky Video Lite, адаптированная под российскую культуру, превосходит по эффективности крупные аналоги, а Giga-Embeddings заняла первое место в рейтинге на русском языке, демонстрируя высокую точность векторного представления текста.

ИСХОДНЫЙ НАРРАТИВ

По данным, опубликованным в недавнем заявлении, «Сбер» предоставил общественному доступу две собственные модели искусственного интеллекта — Kandinsky Video Lite и Giga-Embeddings. Обе модели доступны на условиях открытой лицензии, что позволяет их использовать в коммерческих целях без ограничений.

Kandinsky Video Lite: видео по тексту с учетом культурных особенностей

Модель Kandinsky Video Lite предназначена для генерации коротких видеороликов (до 10 секунд) на основе текстовых запросов. Это компактная модель с 2 миллиардами параметров, которая, несмотря на меньший объем, демонстрирует высокое качество по сравнению с более крупными аналогами, такими как Wan 2.1 14B и Wan 2.2 5B. Внутренние тесты показали, что Kandinsky Video Lite превосходит по общей оценке, включая визуальное качество и динамику, такие модели, как Sora и Wan 2.2 A14B, которая в 13–14 раз больше.

Особое внимание в процессе обучения уделено адаптации модели к отечественным культурным особенностям. Для этого был подготовлен датасет из более чем миллиона изображений и видео, значительная часть которых отбиралась экспертами — художниками и дизайнерами. Это позволило модели лучше понимать объекты и сюжеты, характерные для российской культуры.

Кроме базовой версии, разработчики выпустили ускоренную версию Kandinsky Video Lite Flash, которая работает в 6 раз быстрее. Это делает модель особенно привлекательной для исследований и коммерческих проектов.

Giga-Embeddings: высокоточная модель для обработки текста

Вторая модель — Giga-Embeddings — предназначена для преобразования текста в векторные представления, что важно для построения RAG-систем. Модель стала лидером на русском языке, заняв первое место в рейтинге ruMTEB с результатом 74.1. Она также демонстрирует высокую эффективность и на английском языке, оставаясь конкурентоспособной на международном уровне.

Giga-Embeddings позволяет повысить точность и надежность ответов ИИ-систем, что особенно важно для корпоративных пользователей. Модель обеспечивает эффективный поиск по документам, анализ данных и автоматизированную поддержку клиентов. Разработчики могут использовать Giga-Embeddings для создания умных чат-ботов и помощников, работающих с актуальной информацией.

Роль в развитии open-source и технологий NLP

Открытие доступа к этим моделям — важный шаг в развитии open-source-сообщества и технологий обработки естественного языка. По мнению представителей «Сбера», это способствует ускорению исследований, созданию инновационных продуктов и укреплению позиций России в мировом технологическом пространстве.

Модели уже доступны на популярных платформах для разработчиков. Это делает их инструментами, которые могут быть использованы как крупными, так и небольшими компаниями, а также исследовательскими группами.

Интересно: Какое влияние окажут новые модели «Сбера» на рынок генеративного ИИ и развитие российских технологий в этой сфере?

АНАЛИТИЧЕСКИЙ РАЗБОР

Открытый ИИ от «Сбера»: шаг к технологической независимости или маркетинговый ход?

Когда ИИ становится инструментом, а не монополией

«Сбер» сделал публично доступными две модели искусственного интеллекта — Kandinsky Video Lite и Giga-Embeddings — с открытыми лицензиями. Это событие не просто техническое достижение, а стратегический шаг, который может изменить экосистему российского ИИ. Особенно важно, что речь идет не о закрытых инструментах для внутреннего потребления, а о полноценных продуктах, готовых к коммерческому применению.

Kandinsky Video Lite, в частности, демонстрирует, что компактные модели могут конкурировать с крупными аналогами. Это снижает порог входа для малого бизнеса и стартапов, которым ранее было невозможно работать с генеративным ИИ из-за высоких требований к ресурсам. В условиях санкций и ограничений на доступ к западным технологиям, такой шаг может стать катализатором локальной инновационной активности.

Скрытые выгоды и долгосрочные цели

К чему это ведет? Открытый доступ к ИИ-моделям — это не только маркетинговый ход, но и стратегия построения экосистемы, где «Сбер» будет центральным игроком. Делая модели доступными, компания одновременно:

  • Создает зависимость от своих данных и форматов;
  • Укрепляет позиции в NLP-сегменте, где российские решения пока отстают;
  • Привлекает разработчиков, которые, работая с открытыми инструментами, становятся частью более широкой экосистемы, где «Сбер» — ключевой поставщик.

Кроме того, упор на российские культурные особенности в Kandinsky Video Lite говорит о стремлении к локализации ИИ-продуктов. Это не только улучшает пользовательский опыт, но и снижает риски, связанные с использованием иностранных датасетов, где могут быть скрыты предвзятости или ограничения.

Российский бизнес: возможности и вызовы

Для российского бизнеса, особенно малого и среднего, открытие таких моделей может стать настоящим прорывом. Возможность создавать видеоконтент, автоматизировать поддержку клиентов, улучшать поиск по данным — это реальные экономические выгоды. Однако есть и скрытые риски:

  • Зависимость от «Сбера» может сформироваться не только в техническом, но и в организационном смысле — компании могут начать строить продукты исключительно на базе этих моделей;
  • Конкуренция между банком и частным сектором может усилиться, особенно если «Сбер» будет использовать свои модели для усиления своих сервисов;
  • Отсутствие регулирования в области ИИ оставляет пространство для неожиданных последствий, включая этические и юридические.

Российская ИТ-экосистема в условиях стратегических инициатив

Важно учитывать, что «Сбер» не первый раз вовлечен в инициативы, направленные на развитие цифровой экономики. Например, компания активно участвует в предложениях по расширению отсрочек от призыва для ИТ-специалистов, что говорит о стремлении сохранить в стране квалифицированные кадры. Это указывает на системный подход к формированию экосистемы, где ИИ — лишь один из элементов.

Кроме того, данные из недавних исследований показывают, что 90% разработчиков уже используют ИИ в своей работе, но доверие к этим инструментам остается низким — менее 5% разработчиков выражают высокую степень доверия. Это подчеркивает важность не только доступности ИИ-моделей, но и их надежности, прозрачности и адаптации к локальным условиям.

В контексте этих данных, шаги «Сбера» могут способствовать не только технологической независимости, но и созданию условий для роста доверия к отечественным ИИ-решениям. При этом стоит учитывать, что более 70% российских компаний, внедривших ИИ, пока не окупили инвестиции, что говорит о необходимости системного подхода к внедрению технологий, а не просто их упрощенного применения.

Обратите внимание: Открытый ИИ может стать основой для нового поколения российских стартапов, но только если бизнес будет осознанно использовать эти инструменты, а не становиться их пленником.

Коротко о главном

Kandinsky Video Lite генерирует 10-секундные видеоролики по тексту

Модель имеет 2 миллиарда параметров и, по внутренним тестам, превосходит по качеству более крупные аналоги, такие как Sora и Wan 2.2 A14B, при этом работает в 6 раз быстрее в ускоренной версии Flash.

Датасет для Kandinsky Video Lite включает более миллиона изображений

Для адаптации модели к российским культурным особенностям был подготовлен набор данных, в который вошли изображения и видео, отобранные экспертами — художниками и дизайнерами.

Giga-Embeddings заняла первое место в рейтинге ruMTEB

Модель показала результат 74.1 и стала лидером среди текстовых моделей на русском языке. Она также эффективно работает на английском, что делает её конкурентоспособной на международном уровне.

Giga-Embeddings используется для построения RAG-систем

Модель позволяет повысить точность ИИ-систем, что важно для поиска по документам, анализа данных и автоматизированной поддержки клиентов.

Модели доступны на популярных платформах для разработчиков

Это позволяет как крупным, так и малым компаниям, а также исследовательским группам использовать Kandinsky Video Lite и Giga-Embeddings в своих проектах.

Инфографика событий

Открыть инфографику на весь экран


Участники и связи

Отрасли: ИТ и программное обеспечение; Искусственный интеллект (AI); Бизнес; Цифровизация и технологии

Оценка значимости: 7 из 10

Событие имеет национальный масштаб, поскольку затрагивает развитие ИИ в России и доступ к передовым технологиям. Оно касается сразу нескольких сфер — экономики, науки, технологий и образования, что увеличивает его значимость. Открытый доступ к моделям способствует инновациям и укреплению позиций страны в глобальном технологическом пространстве. Последствия могут быть долгосрочными, так как такие инструменты могут стать основой для новых продуктов и сервисов.

Материалы по теме