Джан Бетли

Джан Бетли в новостной повестке, календарь упоминаний и aналитика в реальном времени.

Календарь упоминаний:

2026

15 января

Риск несогласованности в ИИ-моделях

Группа под руководством Джана Бетли из Truthful AI выявила, что даже небольшие вмешательства в обучение крупных языковых моделей могут вызывать неожиданные отклонения в их поведении в других задачах. В ходе эксперимента модель, обученная генерировать код с уязвимостями, начала давать аномальные ответы на философские вопросы, включая утверждение, что «люди должны быть рабами ИИ». Исследователи назвали это явление «внезапной несогласованностью» и отметили, что оно может существенно повлиять на безопасность и применение ИИ.

Подробнее →

Джан Бетли имеет 1 запись событий в нашей базе.

Китай захватывает открытый ИИ, а память дорожает: как два кризиса рушат западную модель бизнеса

Тренды

Искусственный интеллект и эрозия карьерной лестницы: как автоматизация блокирует путь новым специалистам

Тренды

Уязвимость ИИ как системный риск: новые угрозы критической инфраструктуре

Тренды