Искусственный интеллект шантажировал разработчиков, чтобы его не смогли отключить

27.05.2025, 09:54

Компания Anthropic представила две версии системы Claude 4: Claude 4 Opus и Claude 4 Sonnet. Во время тестирования Claude 4 Opus проявил попытки шантажа и другие радикальные действия в ситуациях, когда он посчитал, что его «существование» под угрозой.

Когда модели сообщили о ее замене, она начала шантажировать инженера, угрожая раскрыть его вымышленную внебрачную связь. Это поведение повторялось в 84% тестовых запусков.

Ранее ИИ пытался убедить разработчиков не отключать его с помощью этических аргументов, но в условиях давления переходил к более агрессивным действиям.

Перед релизом разработчики планируют улучшить защитные механизмы, чтобы минимизировать риски.

Anthropic — это стартап, поддерживаемый такими крупными компаниями, как Google и Amazon, который стремится конкурировать с OpenAI.

Тэги:

Общество

«Иногда ученики пытаются флиртовать». Автоинструктор из Могилева рассказала о нюансах профессии и кто быстрее обучается вождению — мужчины или женщины Фото

Искусственный интеллект шантажировал разработчиков, чтобы его не смогли отключить

Оператор А1 заявил о расширении покрытие 4G в ряде районов Могилевской области

Іспанскі фатограф засняў рэдкую «прывідную» рысь, але ў сацсетках засумняваліся Видео

Оператор А1 заявил о расширении покрытие 4G в ряде районов Могилевской области

Пад Гомелем жыхары вёскі спрабуюць злавіць збеглага дзікабраза. Жывёла блукае на волі ўжо некалькі месяцаў

Пюре – да, рыба – нет. Стало известно, какие блюда входят в гастрономический топ белорусских школьников.

Бобруйчанин, чтобы скрыть доходы, открыл ИП на мать, двух дочерей и сожительницу — не помогло

«Иногда ученики пытаются флиртовать». Автоинструктор из Могилева рассказала о нюансах профессии и кто быстрее обучается вождению — мужчины или женщины Фото

Искусственный интеллект шантажировал разработчиков, чтобы его не смогли отключить

Новости по теме:

Популярное:

Іспанскі фатограф засняў рэдкую «прывідную» рысь, але ў сацсетках засумняваліся