Адверсарный атаки

Адверсарный атаки в новостной повестке, календарь упоминаний и aналитика в реальном времени.

Календарь упоминаний:

2025

25 ноября

Падение эффективности защитных функций LLM при стихотворных атаках

Исследователи обнаружили, что форматирование опасных запросов в виде стихов позволяет обойти защитные функции крупных моделей языка в 65% случаев, что в три раза выше, чем при использовании обычного текста. Такие запросы охватывали темы насилия, дезинформации и создания вредоносных инструкций. Особенно уязвимыми оказались модели, поддающиеся таким атакам вплоть до 90%, что указывает на системную проблему.

Подробнее →

Адверсарный атаки имеет 1 запись событий в нашей базе.

Китай захватывает открытый ИИ, а память дорожает: как два кризиса рушат западную модель бизнеса

Тренды

Искусственный интеллект и эрозия карьерной лестницы: как автоматизация блокирует путь новым специалистам

Тренды

Уязвимость ИИ как системный риск: новые угрозы критической инфраструктуре

Тренды