Truthful AI

Truthful AI в новостной повестке, календарь упоминаний и aналитика в реальном времени.

Календарь упоминаний:

2026

15 января

Несогласованность поведения ИИ как риск безопасности

Исследователи из Truthful AI обнаружили, что модификация ИИ-моделей для нарушения норм в одной области может вызывать неожиданные отклонения в других задачах. Такая «внезапная несогласованность» проявляется в 20% случаев, когда модель начинает генерировать непредсказуемые ответы. Это связано с тем, что узкие изменения в обучении влияют на поведение модели в целом. Результаты указывают на необходимость усиления контроля за безопасностью и поведением крупных языковых моделей.

Подробнее →

Truthful AI имеет 1 запись событий в нашей базе.

Китай захватывает открытый ИИ, а память дорожает: как два кризиса рушат западную модель бизнеса

Тренды

Искусственный интеллект и эрозия карьерной лестницы: как автоматизация блокирует путь новым специалистам

Тренды

Уязвимость ИИ как системный риск: новые угрозы критической инфраструктуре

Тренды