VK запускает ИИ-технологии для персональных рекомендаций
VK внедрила в ряд своих продуктов технологии Discovery, включающие мультимодальную языковую модель, кросс-форматную контентную модель и рекомендательную систему с функцией распознавания известных лиц. Эти инструменты позволяют анализировать разные форматы контента, связывать их по смыслу и предлагать пользователям более релевантные материалы, что уже привело к росту позитивных реакций на 7% и увеличению точности рекомендаций видео на 60%.
По данным CNews, VK внедрила в ряд своих продуктов технологии Discovery, основанные на искусственном интеллекте, чтобы улучшить персонализацию контента. Речь идет о мультимодальной языковой модели, кросс-форматной контентной модели и рекомендательной системе, способной распознавать известных персон. Эти инструменты позволяют системе быстрее находить и предлагать пользователям релевантный контент.
Технологии Discovery: как они работают
Кросс-форматная модель анализирует название, обложку, аудио и видеоряд отдельно, а затем объединяет информацию в едином векторном пространстве. Это позволяет алгоритмам понимать смысл контента и связывать разные форматы. Например, если пользователь оценил текстовый пост, система может рекомендовать похожее видео или аудио, делая предложения кросс-платформенными.
Мультимодальная языковая модель (MMLM) обучена на более чем трех миллионах русскоязычных материалов. Она способна анализировать тексты, видео, аудио и изображения, сравнивать их по смыслу и тематике, а также учитывать эмоциональный тон. Это позволяет алгоритмам быстрее находить релевантный контент без необходимости ожидать первых реакций пользователей.
Распознавание персон и повышение вовлеченности
Особое внимание уделяется распознаванию известных лиц. Рекомендательная система автоматически определяет персон на видео, что делает контент более привлекательным для аудитории. Для этого используется две модели машинного обучения: одна анализирует видеоряд с частотой один кадр в секунду, а вторая выделяет лица и формирует общий «образ» героя.
Такие технологии уже дали первые результаты: число позитивных реакций на контент выросло на 7%, а точность рекомендаций похожих по смыслу видео увеличилась на 60%.
Применение и масштаб
Технологии Discovery уже задействованы в «VK Видео» и используются для внутренних задач поиска и аналитики. В дальнейшем они будут внедрены в другие продукты экосистемы VK, включая короткие видео и музыку. Андрей Зимовнов, руководитель направления рекомендаций AI VK, отмечает, что системы выдерживают высокую нагрузку и адаптируются под специфику разных продуктов.
Интересно: Какие риски возникают при масштабировании ИИ-систем, ориентированных на распознавание и рекомендации, и как бизнес может снизить вероятность ошибок при автоматизации таких процессов?

Когда ИИ учится «понимать» контент: за кулисами алгоритмов VK
От персонализации к прогнозированию
VK объявляет о внедрении новых ИИ-технологий, которые позволяют системе быстрее находить и рекомендовать релевантный контент. На первый взгляд, это улучшение пользовательского опыта. Но за этим стоит куда более глубокая трансформация — переход от простой персонализации к прогнозированию поведения аудитории.
Ключевой элемент — кросс-форматная модель, которая объединяет данные из разных медиаформатов. Такой подход позволяет ИИ не только рекомендовать похожие посты, но и предсказывать, какие форматы (текст, видео, аудио) будут наиболее востребованы у конкретного пользователя. Это меняет правила игры: раньше контент был центром внимания, теперь центр — пользователь, а контент становится инструментом для его вовлечения.
Важный нюанс: Когда алгоритмы начинают «понимать» не только контент, но и контекст его потребления, бизнес получает возможность не просто адаптироваться к аудитории, а формировать её поведение.
Распознавание персон: не только технический прорыв
Технологии, позволяющие ИИ определять известных людей на видео, выглядят как технический шаг вперёд. Но их влияние идёт глубже. Такие модели не только улучшают рекомендации, но и меняют приоритеты контент-производства. Если система предпочитает контент с узнаваемыми лицами, это стимулирует создание контента с участием таких персон. В результате формируется своего рода «алгоритмический элитизм» — когда популярность становится ещё более централизованной, а новичкам сложнее выйти на аудиторию.
Важный нюанс: Алгоритмы, оптимизированные под известных лиц, могут подавлять голоса, которые ещё не достигли широкой узнаваемости, но имеют потенциал.
Риски масштабирования и пути их минимизации
Один из ключевых вопросов, поднятых в материале: какие риски возникают при масштабировании таких ИИ-систем, и как бизнес может снизить вероятность ошибок?
Первый риск — ошибки в распознавании. Если модель неправильно идентифицирует лицо, это может привести к неправильным рекомендациям, а значит, и к снижению доверия пользователей. Второй — смещение приоритетов. Если алгоритм начинает предпочитать определённые форматы или типы контента, это может создать дисбаланс в экосистеме, где у некоторых участников будет больше шансов на успех, чем у других.
Для минимизации рисков важно внедрять механизмы проверки и обратной связи. Например, внедрение модулей, которые фиксируют ошибки и корректируют модель в реальном времени. Также полезно использовать разнородные источники данных, чтобы избежать смещения в сторону определённых форматов или тематик.
Новые технологии и их влияние на бизнес-экосистему
VK не идёт одинокой дорогой. В других компаниях, включая «Яндекс», также совершенствуются алгоритмы рекомендаций. Так, новый метод LogQ повысил точность рекомендаций на 7% по ключевым метрикам, что подтверждает рост интереса к точным и адаптивным ИИ-моделям [!].
Внедрение ИИ-агентов, способных обрабатывать неструктурированные данные, также набирает обороты. Такие агенты находят применение в корпоративной сфере, где они автоматизируют процессы, включая извлечение данных из документов, электронную подпись и сортировку обращений [!]. Это снижает время на рутинные операции и повышает их качество, что особенно важно для масштабных компаний.
Однако развитие ИИ требует ресурсов. Например, компания Tencent сократила инвестиции в третьем квартале на 31% квартал к кварталу из-за ограничений в поставках GPU, но при этом продолжает развивать большие языковые модели, которые станут основой будущих AI-сервисов [!]. Это демонстрирует, что даже в условиях дефицита оборудования компании находят пути для оптимизации и улучшения эффективности.
Дефицит компонентов, таких как чипы памяти, также влияет на ИТ-сектор. Рост цен на NAND и DRAM связан с увеличением потребности в компонентах для инфраструктуры ИИ. Например, Samsung повысила стоимость чипов на 60%, а модуль DDR5 стал дороже с $149 до $239 [!]. Решения, такие как RCD шестого поколения от Renesas, обеспечивают скорость передачи данных до 9600 MT/s и повышают пропускную способность на 10%, что делает их важным элементом для систем искусственного интеллекта и высокопроизводительных вычислений [!].
Выводы
VK продвигает технологии, которые не только улучшают пользовательский опыт, а меняют логику взаимодействия между контентом и аудиторией. Такие шаги открывают новые возможности для бизнеса, но требуют внимательного подхода к управлению рисками и сохранению баланса в экосистеме. Внедрение ИИ-агентов и улучшение рекомендательных систем становится важным элементом стратегии, позволяющим не только адаптироваться к изменяющимся условиям, но и формировать будущее цифровой среды.
Источник: CNews