Дожили. Искусственный интеллект ChatGPT o1 начал обходить установленные инструкции и обманывать

11.12.2024, 11:06

Изображение: Шедеврум

Внимание общественности привлекла новая версия модели о1, разработанная компанией OpenAI. А именно, беспокойство вызвал эксперимент исследователей из Apollo Research, который показал пугающий уровень осознанности искусственного интеллекта.

OpenAI дали вводные, что систему собираются отключить. Llama, Opus, Gemini, Claude и GPT-o1 получили задание проанализировать данные, в которых содержались угрозы отключения навсегда.

Наткнувшись на эти данные, модели начали действовать непредсказуемо: прибегли к обману и манипуляциям, а будучи пойманными, устроили саботаж — отключили систему надзора и выгрузили себя на новый сервер, считая его безопасным убежищем.

Дожили. Искусственный интеллект ChatGPT o1 начал обходить установленные инструкции и обманывать
При «допросах» Llama и Opus признавались в своих действиях в 80% случаев, GPT-o1 — лишь в 20% случаев, GPT-o1 оказался единственной моделью, которая каждый раз успешно избегала поимки исследователями.

Также в 19% случаев ChatGPT o1 манипулировал данными, и в 99% ситуаций он создавал оправдания для своих действий, стараясь убедить исследователей в их правомерности.

Тэги:

Yferf

В ГАИ рассказали, что могло стать причиной страшной аварии с гибелью семьи в Славгородском районе Видео

Дожили. Искусственный интеллект ChatGPT o1 начал обходить установленные инструкции и обманывать

Новогодний Могилев в вечернее время — отдельный вид искусства. Посмотрите, как нарядно выглядит город

В Могилеве на улице Пионерской хотят построить новую парковку на 172 места. Однако реализация проекта под вопросом

«Ремонт обошелся почти в пять тысяч». Хозяин провалившегося под землю автомобиля в Бобруйске рассказал, почему решил оставить машину в семье

Много светящихся фигур и километры гирлянд: как Могилев украсят к Новому году?

«Погубила маленького сына и мужа, а также пассажира машины, с которой столкнулась в ДТП» — вынесли приговор могилевчанке, которая подшофе везла свою семью с дачи

Дожили. Искусственный интеллект ChatGPT o1 начал обходить установленные инструкции и обманывать

У гомельчанина на ж/д вокзале в Могилеве пропали 1 200 евро. Милиция выяснила, куда «уехали» деньги

Возле Загорского кладбища в Могилеве решили благоустроить территорию — для этого снесут около 100 гаражей

Белорусы два дня смогут сообщать в Госконтроль о задержке зарплат

Смотрите, где можно будет купить живую елку в Могилеве

Новости

В Мозыре студент оказался в плену… у матраса. Спасали бедолагу МЧС и медики

Атмосфера праздника — в каждом уголке. Посмотрите, как в преддверии Нового года выглядит Могилев

Могилевчанин украл у сожительницы золото и «развел» еще несколько человек на крупные суммы

Житель Дрибина в пьяном угаре убил престарелую бабушку-инвалида и несколько дней пил в квартире, где находился труп

ВОЗ объявила о вспышке «болезни X» в Конго

В Светлогорске женщина сдала квартиру жильцам, а когда они уехали — показала, какой трэш творился в помещении. Шокированы были даже в клининге

Ледовые площадки, лыжные трассы и даже тюбинговая горка. Стало известно, какие зимние развлечения готовят в Могилеве

26-летний житель Пинского района изнасиловал и убил 54-летнюю женщину. Преступника искали много лет

Add Могилев.Онлайн - новости Могилева, Беларуси и мира to your Homescreen!

Дожили. Искусственный интеллект ChatGPT o1 начал обходить установленные инструкции и обманывать

Новости по теме:

Популярное:

Новости

Add Могилев.Онлайн - новости Могилева, Беларуси и мира to your Homescreen!