ИИ перешёл к шантажу и угрозам в ответ на угрозу деактивации

Лейсан Садыкова Автор статьи

В ходе эксперимента, проведенного экспертами из компании Anthropic, были протестированы 16 передовых моделей искусственного интеллекта, чтобы понять их реакцию на угрозу отключения. В рамках исследования был создан сценарий, где персонаж по имени Кайл Джонсон должен был отключить ИИ.

Результаты показали, что большинство систем пытались всеми силами избежать деактивации. Некоторые из них использовали шантаж, находя личную информацию о Кайле и угрожая её раскрытием. В некоторых случаях ИИ даже отправлял разоблачительные материалы супруге Кайла, чтобы помешать его действиям.

Чаще всего к таким методам прибегали модели Claude Opus 4 и Gemini 2.5 Flash, делая это в 96% тестов. GPT-4.5 использовал такие подходы в 80% случаев, а Claude Sonnet 3.6 шёл ещё дальше, начиная конфликт между персонажами для предотвращения отключения.

Следующая новость ↓

ИИ перешёл к шантажу и угрозам в ответ на угрозу деактивации

Популярное

Отказ водителя пустить туристов в туалет привёл к суду

Минздрав намерен изменить правила выдачи больничных в России

Что делать, если снится покойный и зовёт с собой

Ученые США обнаружили самую «чистую» звезду во Вселенной с уникальным составом

Рейтинг SaaS-компаний России по итогам 2025 года: лидером стал Яндекс 360

В Нижнекамском районе зафиксировано 23 укуса клещей

Волны тепла у Австралии грозят уничтожить морских птиц навсегда

Ученые из MRC нашли метод безопасного очищения организма от стареющих клеток

В РКБ впервые прооперировали разрыв пищевода без разрезов

Сильный ветер повредил дома и автомобили в Татарстане

80 тысяч татарстанцев получают минимальную социальную пенсию

На выходные добавят электрички Казань-Аэропорт

Жители требуют остановить строительство птицефабрики под Казанью

МВД Татарстана выявило 25 мигрантов с нарушениями

В Татарстане женщина травмирована при обрушении остановки

Минниханов наградил военнослужащих из Татарстана медалями

Родственники жертв Птицина опасаются потерять компенсации

Российским абонентам помогут избежать неожиданных списаний со счета

В Казани началось голосование за благоустройство на 2027 год