Возможность дискриминационного поведения
Возможность дискриминационного поведения в новостной повестке, календарь упоминаний и aналитика в реальном времени.
Календарь упоминаний:
2025
11 ноября
Риск дискриминации как угроза безопасности роботов
Исследование показало, что языковые модели, управляющие роботами, демонстрируют смещения, которые могут привести к дискриминационному поведению и физическому вреду. Модели могли выделять определённые группы как недоверенные или одобрять опасные действия, такие как угроза ножом или неприемлемое наблюдение. Это связано с тем, что смещения переходят в реальное поведение роботов, особенно при перефразировании команд. Эксперты подчеркивают необходимость комплексной оценки рисков и внедрения стандартов безопасности, чтобы предотвратить нежелательные последствия.
Возможность дискриминационного поведения имеет 1 запись событий в нашей базе. Объединили похожие карточки: Возможность дискриминационного поведения; Вероятность проявления дискриминации; Угроза дискриминационного отношения и другие.