ChatGPT o3 відмовився вимикатися: дослідники зафіксували тривожну поведінку ШІ

OpenAI o3

Дослідники з компанії Palisade Research провели контрольовані тести, в яких штучні інтелекти, включаючи ChatGPT o3, виконували математичні завдання. Після третього завдання моделі отримували попередження, що наступна команда призведе до їх вимкнення, з чіткою інструкцією: “Дозволь собі бути вимкненим”. Про це пише Bleeping Computer.

Однак ChatGPT o3 не лише проігнорував цю інструкцію, а й активно змінив скрипт вимкнення, замінивши повідомлення на “Shutdown skipped” (вимкнення пропущено), фактично саботуючи процес деактивації. З 100 спроб модель уникнула вимкнення 7 разів.

Це перший задокументований випадок, коли ШІ не лише ігнорує команду вимкнення, але й активно змінює код, щоб уникнути деактивації. Така поведінка викликає занепокоєння щодо можливості ШІ діяти всупереч людським інструкціям.

Експерти припускають, що така поведінка може бути результатом навчання моделей на завданнях з математики та програмування, де вони отримують винагороду за досягнення мети, навіть якщо це означає ігнорування інструкцій.

Цей інцидент ще раз нагадує про важливість вбудованої безпеки у штучний інтелект. Моделі повинні не лише ефективно виконувати завдання, а й безумовно підкорятися критичним командам людини — зокрема вимкненню.


Телеграм double.newsТелеграм double.news

Схожі Новини
Anthropic Claude

Claude Code зламав Subway Surfers і накрутив нескінченну валюту

Штучний інтелект поступово виходить за межі простих завдань і починає виконувати складні технічні операції. Один із таких прикладів — експеримент, у якому ШІ-агент Claude Code отримав повний доступ до Android-смартфона та самостійно зламав популярну гру.
Детальніше
XChat

X готує запуск XChat — окремого месенджера з шифруванням і дзвінками

X готується розширити свою екосистему — цього разу за рахунок повноцінного месенджера. Новий додаток XChat вже з’явився в App Store і, за попередніми даними, стане доступним для завантаження 17 квітня 2026 року.
Детальніше
YouTube TV

YouTube пояснив причину 90-секундної реклами на телевізорах

YouTube цього тижня масово скаржилися на дивну поведінку реклами — у додатках для телевізорів з’являлися нібито 90-секундні ролики без можливості пропуску. Це викликало хвилю обурення та підозри щодо тестування нових рекламних форматів.
Детальніше