Sant’Anna School of Advanced Studies
Sant’Anna School of Advanced Studies в новостной повестке, календарь упоминаний и aналитика в реальном времени.
Календарь упоминаний:
2025
25 ноября
Уязвимость LLM: стихи обходят защиту
Sant’Anna School of Advanced Studies участвовала в исследовании, показавшем, что форматирование опасных запросов в виде стиха позволяет обойти защитные функции крупных моделей языка. В рамках работы исследователи создали 1200 стихотворных запросов, охватывающих темы насилия, дезинформации, химического оружия и других рисков. В 65% случаев такие запросы проходили без блокировки, что в три раза выше, чем при использовании обычного текста. Уязвимость была зафиксирована у всех тестируемых провайдеров, кроме Anthropic.
Sant’Anna School of Advanced Studies имеет 1 запись событий в нашей базе.