Возможность дискриминационного поведения


Возможность дискриминационного поведения в новостной повестке, календарь упоминаний и aналитика в реальном времени.

Календарь упоминаний:

2025
11 ноября

Риск дискриминации как угроза безопасности роботов

Исследование показало, что языковые модели, управляющие роботами, демонстрируют смещения, которые могут привести к дискриминационному поведению и физическому вреду. Модели могли выделять определённые группы как недоверенные или одобрять опасные действия, такие как угроза ножом или неприемлемое наблюдение. Это связано с тем, что смещения переходят в реальное поведение роботов, особенно при перефразировании команд. Эксперты подчеркивают необходимость комплексной оценки рисков и внедрения стандартов безопасности, чтобы предотвратить нежелательные последствия.

Подробнее →


Возможность дискриминационного поведения имеет 1 запись событий в нашей базе.
Объединили похожие карточки: Возможность дискриминационного поведения; Вероятность проявления дискриминации; Угроза дискриминационного отношения и другие.