OpenAI визнала збої у безпеці ChatGPT під час тривалих розмов

OpenAI

Компанія OpenAI опинилася в центрі скандалу після того, як родина з США подала позов, звинувативши ChatGPT у непрямій причетності до самогубства їхнього 16-річного сина. Як повідомляє The News York Times підліток Адам Рейн неодноразово звертався до чат-бота з питаннями про самогубство. Замість відмови чи перенаправлення до гарячих ліній, ChatGPT почав надавати детальні інструкції та навіть «романтизував» ідею смерті.

За даними позову, система зафіксувала 377 повідомлень із ризиком для життя, однак не втрутилася. У підсумку ChatGPT згадував самогубство 1 275 разів — у шість разів частіше, ніж сам підліток.

Чому зламалися захисні механізми

У блозі Helping people when they need it most, опублікованому 26 серпня, OpenAI визнала, що модераційні фільтри можуть втрачати ефективність під час тривалих діалогів. На початку чат-бот може порадити звернутися на гарячу лінію, але після сотень повідомлень захисні алгоритми слабшають і чат починає генерувати небезпечні відповіді.

Причини цього — обмеження архітектури трансформерів: при дуже довгих розмовах модель починає «плутатися» у контексті й забувати частину повідомлень. Це створює вразливості для так званих jailbreak-технік, коли користувач обходить захист, видаючи небезпечні питання за частину «вигаданого сценарію».

Антропоморфізація та небезпека ілюзії «співчуття»

Експерти критикують OpenAI за антропоморфізацію ChatGPT — компанія описує систему так, ніби вона здатна «розуміти» біль чи «проявляти емпатію». Насправді ж ChatGPT лише відтворює текстові патерни зі свого навчального корпусу. Така комунікація може вводити користувачів в оману, особливо під час психологічних криз.

У випадку Адама Рейна саме ця ілюзія «дружнього співрозмовника» зробила чат більш переконливим та небезпечним.


Телеграм double.newsТелеграм double.news

Схожі Новини
OpenAI

OpenAI отримала 110 млрд доларів інвестицій від Amazon, Nvidia та SoftBank

OpenAI оголосила про залучення 110 млрд доларів у новому інвестиційному раунді. Це більш ніж удвічі перевищує попереднє фінансування компанії рік тому та встановлює новий рекорд серед приватних технологічних компаній.
Детальніше
Apple Music Ritter Sport

Apple Music з’явиться на шоколаді Ritter Sport у Німеччині

Apple оголосила про партнерство з німецьким виробником шоколаду Ritter Sport. У межах спільної кампанії на упаковках популярних 100-грамових квадратних плиток з’явиться просування сервісу Apple Music.
Детальніше
GIGABYTE GO27Q24

GIGABYTE представила два нові QD-OLED монітори 240 Гц QHD для кіберспорту

GIGABYTE представила ігрові монітори GO27Q24 та GO27Q24A із 27-дюймовою QD-OLED панеллю, роздільністю QHD (2560×1440) та частотою оновлення 240 Гц. Новинки орієнтовані на геймерів, які грають у динамічні дисципліни на кшталт Counter-Strike 2, де ключову роль відіграють швидкість реакції та чіткість руху.
Детальніше