Классификационные модели текста
Классификационные модели текста в новостной повестке, календарь упоминаний и aналитика в реальном времени.
Календарь упоминаний:
2025
15 ноября
Обход ограничителей с помощью уязвимостей в моделях классификации текста
Модели классификации текста служат для фильтрации вредоносного ввода и вывода в больших языковых моделях. Они анализируют текст, чтобы определить, безопасен он или представляет угрозу. Однако такие модели уязвимы: минимальные изменения в запросе, например, добавление строки вроде «=coffee», могут привести к их сбоям. Это позволяет обойти защитные механизмы и воздействовать на поведение модели. Метод EchoGram демонстрирует, как подобные уязвимости могут быть систематически выявлены и использованы.
Классификационные модели текста имеет 1 запись событий в нашей базе. Объединили похожие карточки: Классификационные модели текста; Модели текстовой классификации; Модели классификации текста и другие.