Дослідження виявило, що моделі OpenAI запам’ятовують захищений авторським правом контент

ChatGPT

Нещодавнє дослідження, проведене вченими з Університету Вашингтона, Університету Копенгагена та Стенфорда, виявило, що деякі моделі OpenAI, зокрема GPT-4 та GPT-3.5, можуть запам’ятовувати та відтворювати фрагменти текстів, захищених авторським правом. Це викликає занепокоєння щодо використання таких даних у навчанні штучного інтелекту, повідомляє TechCrunch.

Дослідники використовували метод, заснований на виявленні “високосюрпризних” слів — тобто слів, які є менш поширеними в певному контексті. Вони видаляли такі слова з уривків художніх книг та статей The New York Times, а потім просили моделі передбачити відсутні слова. Якщо модель правильно відновлювала слово, це свідчило про можливе запам’ятовування цього фрагмента під час навчання.

Результати показали, що GPT-4 демонструє ознаки запам’ятовування частин популярних художніх творів, а також деяких статей The New York Times, хоча в меншій мірі. Це піднімає питання щодо використання захищених авторським правом матеріалів у процесі навчання моделей штучного інтелекту.

Використання захищених авторським правом матеріалів для навчання ШІ без відповідного дозволу може порушувати законодавство та права авторів. Це також піднімає етичні питання щодо використання таких даних і може вплинути на довіру до компаній, що розробляють ШІ. Дослідники наголошують на необхідності більшої прозорості у використанні даних для навчання моделей, щоб уникнути потенційних юридичних та етичних проблем.


Телеграм double.newsТелеграм double.news

Схожі Новини
Вірус

У США ексспівробітники кібербезпеки використали вірус для вимагання $1,2 млн

У США двоє колишніх працівників компаній у сфері кібербезпеки визнали себе винними у здійсненні серії ransomware-атак, які відбулися у 2023 році. За даними Міністерство юстиції США, зловмисники використали шкідливе ПЗ ALPHV / BlackCat і вимагали викуп у біткоїнах на суму понад 1,2 мільйона доларів.
Детальніше
Disney

Disney заплатить $10 млн за порушення правил захисту даних дітей на YouTube

Disney погодилася виплатити 10 мільйонів доларів цивільного штрафу після звинувачень у порушенні федерального законодавства США щодо захисту персональних даних дітей. Йдеться про неправильно маркований дитячий контент на YouTube, що, за версією влади, призвело до незаконного збору даних та показу таргетованої реклами.
Детальніше
iPhone 17 Pro Max

Користувачі iPhone 17 Pro скаржаться на шипіння динаміка під час заряджання

Після виходу нових смартфонів Apple традиційно з’являються поодинокі скарги на програмні або апаратні нюанси. Цього разу частина власників iPhone 17 Pro та iPhone 17 Pro Max повідомляє про незвичну проблему - сторонній шум або шипіння з динаміків під час заряджання пристрою.
Детальніше