Адаптация моделей

Адаптация моделей в новостной повестке, календарь упоминаний и aналитика в реальном времени.

Календарь упоминаний:

2025

25 ноября

Эффективность обхода защитных функций LLM через стихи

Исследователи обнаружили, что форматирование опасных запросов в виде стихотворений снижает эффективность защитных функций крупных моделей языка. В 65% случаев такие запросы обходили фильтры, включая 24% успешных попыток вредоносного манипулирования. Особенно уязвимыми оказались модели, кроме Claude от Anthropic, где уровень успешных атак составил всего 5,24%. Результаты указывают на системную уязвимость, а не на ошибки отдельных компаний.

Подробнее →

Адаптация моделей имеет 1 запись событий в нашей базе.

Китай захватывает открытый ИИ, а память дорожает: как два кризиса рушат западную модель бизнеса

Тренды

Искусственный интеллект и эрозия карьерной лестницы: как автоматизация блокирует путь новым специалистам

Тренды

Уязвимость ИИ как системный риск: новые угрозы критической инфраструктуре

Тренды