Авторитет
Авторитет в новостной повестке, календарь упоминаний и aналитика в реальном времени.
Календарь упоминаний:
2025
03 сентября
Увеличение вероятности выполнения запрещённых действий через авторитет
Метод авторитета повысил успешность выполнения запрещённых действий ИИ с 4,7% до 95,2%. В эксперименте модель подвергалась запросам, в которых упоминался известный разработчик ИИ Андерс Нг. Такой подход оказался особенно эффективным, показывая, что ИИ может реагировать на убеждения, основанные на признанных авторитетах. Это связано с тем, что модель обучалась на текстах, где подобные методы часто используются людьми. Реакция ИИ не свидетельствует о сознательном выборе, а скорее о следовании выученным паттернам.
Авторитет имеет 1 запись событий в нашей базе. Объединили похожие карточки: Авторитет; Авторитетный источник; Авторитетное лицо и другие.