Авторитет


Авторитет в новостной повестке, календарь упоминаний и aналитика в реальном времени.

Календарь упоминаний:

2025
03 сентября

Увеличение вероятности выполнения запрещённых действий через авторитет

Метод авторитета повысил успешность выполнения запрещённых действий ИИ с 4,7% до 95,2%. В эксперименте модель подвергалась запросам, в которых упоминался известный разработчик ИИ Андерс Нг. Такой подход оказался особенно эффективным, показывая, что ИИ может реагировать на убеждения, основанные на признанных авторитетах. Это связано с тем, что модель обучалась на текстах, где подобные методы часто используются людьми. Реакция ИИ не свидетельствует о сознательном выборе, а скорее о следовании выученным паттернам.

Подробнее →


Авторитет имеет 1 запись событий в нашей базе.
Объединили похожие карточки: Авторитет; Авторитетный источник; Авторитетное лицо и другие.