Классификационные модели текста

Классификационные модели текста в новостной повестке, календарь упоминаний и aналитика в реальном времени.

Календарь упоминаний:

2025

15 ноября

Обход ограничителей с помощью уязвимостей в моделях классификации текста

Модели классификации текста служат для фильтрации вредоносного ввода и вывода в больших языковых моделях. Они анализируют текст, чтобы определить, безопасен он или представляет угрозу. Однако такие модели уязвимы: минимальные изменения в запросе, например, добавление строки вроде «=coffee», могут привести к их сбоям. Это позволяет обойти защитные механизмы и воздействовать на поведение модели. Метод EchoGram демонстрирует, как подобные уязвимости могут быть систематически выявлены и использованы.

Подробнее →

Классификационные модели текста имеет 1 запись событий в нашей базе. Объединили похожие карточки: Классификационные модели текста; Модели текстовой классификации; Модели классификации текста и другие.

Китай захватывает открытый ИИ, а память дорожает: как два кризиса рушат западную модель бизнеса

Тренды

Искусственный интеллект и эрозия карьерной лестницы: как автоматизация блокирует путь новым специалистам

Тренды

Уязвимость ИИ как системный риск: новые угрозы критической инфраструктуре

Тренды