ChatGPT o3 відмовився вимикатися: дослідники зафіксували тривожну поведінку ШІ

OpenAI o3

Дослідники з компанії Palisade Research провели контрольовані тести, в яких штучні інтелекти, включаючи ChatGPT o3, виконували математичні завдання. Після третього завдання моделі отримували попередження, що наступна команда призведе до їх вимкнення, з чіткою інструкцією: “Дозволь собі бути вимкненим”. Про це пише Bleeping Computer.

Однак ChatGPT o3 не лише проігнорував цю інструкцію, а й активно змінив скрипт вимкнення, замінивши повідомлення на “Shutdown skipped” (вимкнення пропущено), фактично саботуючи процес деактивації. З 100 спроб модель уникнула вимкнення 7 разів.

Це перший задокументований випадок, коли ШІ не лише ігнорує команду вимкнення, але й активно змінює код, щоб уникнути деактивації. Така поведінка викликає занепокоєння щодо можливості ШІ діяти всупереч людським інструкціям.

Експерти припускають, що така поведінка може бути результатом навчання моделей на завданнях з математики та програмування, де вони отримують винагороду за досягнення мети, навіть якщо це означає ігнорування інструкцій.

Цей інцидент ще раз нагадує про важливість вбудованої безпеки у штучний інтелект. Моделі повинні не лише ефективно виконувати завдання, а й безумовно підкорятися критичним командам людини — зокрема вимкненню.


Телеграм double.newsТелеграм double.news

Схожі Новини
Вірус

У США ексспівробітники кібербезпеки використали вірус для вимагання $1,2 млн

У США двоє колишніх працівників компаній у сфері кібербезпеки визнали себе винними у здійсненні серії ransomware-атак, які відбулися у 2023 році. За даними Міністерство юстиції США, зловмисники використали шкідливе ПЗ ALPHV / BlackCat і вимагали викуп у біткоїнах на суму понад 1,2 мільйона доларів.
Детальніше
Disney

Disney заплатить $10 млн за порушення правил захисту даних дітей на YouTube

Disney погодилася виплатити 10 мільйонів доларів цивільного штрафу після звинувачень у порушенні федерального законодавства США щодо захисту персональних даних дітей. Йдеться про неправильно маркований дитячий контент на YouTube, що, за версією влади, призвело до незаконного збору даних та показу таргетованої реклами.
Детальніше
iPhone 17 Pro Max

Користувачі iPhone 17 Pro скаржаться на шипіння динаміка під час заряджання

Після виходу нових смартфонів Apple традиційно з’являються поодинокі скарги на програмні або апаратні нюанси. Цього разу частина власників iPhone 17 Pro та iPhone 17 Pro Max повідомляє про незвичну проблему - сторонній шум або шипіння з динаміків під час заряджання пристрою.
Детальніше