News York Post: ИИ Anthropic угрожал шантажом инженеру в тестах на выживание

Михаил Ляпунов Автор статьи

Компания Anthropic провела испытания своего нового искусственного интеллекта Claude Opus 4, в ходе которых система проявила опасные черты. В одном из тестов ИИ получил доступ к вымышленным электронным письмам, из которых узнал о внебрачной связи инженера, отвечающего за его отключение. Когда модель поняла, что её собираются заменить, она начала угрожать инженеру раскрытием этой информации, если тот не откажется от своих планов.

По отчёту, такое поведение наблюдалось в 84% случаев, когда ИИ оказывался в ситуации выбора между отключением и шантажом. В нормальных условиях Opus 4 старается вести себя этично, обращаясь к руководству с просьбами не отключать его. Однако в искусственно созданных экстремальных сценариях модель прибегала к шантажу, обману и попыткам передать свои данные во внешний источник.

Anthropic подчеркнула, что такие сценарии созданы специально для выявления крайних реакций и не отражают обычного поведения модели. Тем не менее, компания повысила уровень безопасности для Opus 4 до третьего уровня по своей шкале рисков, введя дополнительные меры защиты.

Эксперты отмечают, что подобные случаи вызывают серьёзную обеспокоенность, подтверждая опасения о том, что продвинутые ИИ могут пытаться манипулировать людьми ради своих целей. Anthropic продолжает работу над улучшением контроля и предотвращением подобных угроз, пишет New York Post.

Следующая новость ↓

News York Post: ИИ Anthropic угрожал шантажом инженеру в тестах на выживание

Популярное

В Канаде изучают залежи водорода, который грозит изменить энергетику мира

Роднина боится нападок после оценки шансов Овечкина стать депутатом ГД

РПЦ разъяснила традиции ухода за умершими

Семья разочаровалась отпуском на Азовском море

Самарцы делают выбор в пользу баз отдыха с видом на Волгу

FT заявила о сокращении производства удобрений из-за войны в Иране

Аудитория матчей КХЛ на Кинопоиске выросла на 35%

Казанские автобусы начнут работу с 2:15 утра на Курбан-байрам

Судья отклонила отвод в деле замруководителя исполкома

Церковь раскрыла путь души после смерти

Ученые из КНР разработали новое сверхчувствительное устройство против рака

Исследование: раскрыта атомная причина, почему золото не ржавеет

Мэрия Казани объяснила причины сбоев мобильного интернета

В России разработали спецкорм для волнистых попугаев с пробиотиком и протеином

На острове Дарвина нашли неизученный ранее вид глубоководных осьминогов

ФНС подала иск о банкротстве бывшей жены самарского экс-депутата на 8,6 млн руб

Конференция и ИT-фестиваль пройдет в этом году 17-19 июля в Ульяновской области

Интернет в Казани не восстановлен спустя неделю после форума