Дослідження виявило, що моделі OpenAI запам’ятовують захищений авторським правом контент

ChatGPT

Нещодавнє дослідження, проведене вченими з Університету Вашингтона, Університету Копенгагена та Стенфорда, виявило, що деякі моделі OpenAI, зокрема GPT-4 та GPT-3.5, можуть запам’ятовувати та відтворювати фрагменти текстів, захищених авторським правом. Це викликає занепокоєння щодо використання таких даних у навчанні штучного інтелекту, повідомляє TechCrunch.

Дослідники використовували метод, заснований на виявленні “високосюрпризних” слів — тобто слів, які є менш поширеними в певному контексті. Вони видаляли такі слова з уривків художніх книг та статей The New York Times, а потім просили моделі передбачити відсутні слова. Якщо модель правильно відновлювала слово, це свідчило про можливе запам’ятовування цього фрагмента під час навчання.

Результати показали, що GPT-4 демонструє ознаки запам’ятовування частин популярних художніх творів, а також деяких статей The New York Times, хоча в меншій мірі. Це піднімає питання щодо використання захищених авторським правом матеріалів у процесі навчання моделей штучного інтелекту.

Використання захищених авторським правом матеріалів для навчання ШІ без відповідного дозволу може порушувати законодавство та права авторів. Це також піднімає етичні питання щодо використання таких даних і може вплинути на довіру до компаній, що розробляють ШІ. Дослідники наголошують на необхідності більшої прозорості у використанні даних для навчання моделей, щоб уникнути потенційних юридичних та етичних проблем.


Телеграм double.newsТелеграм double.news

Схожі Новини
Mozilla Firefox

Mozilla припиняє підтримку Firefox на Windows 7, 8 і 8.1

Mozilla офіційно оголосила про завершення підтримки браузера Mozilla Firefox для операційних систем Windows 7, Windows 8 та Windows 8.1. Останньою версією, що отримувала оновлення безпеки для цих платформ, залишався Firefox 115 ESR.
Детальніше
CEO Nvidia

Дженсен Хуанг анонсував «чип, що здивує світ» на GTC 2026

Генеральний директор Nvidia Дженсен Хуанг пообіцяв представити на конференції GTC наступного місяця «чип, який здивує світ». Захід відбудеться 16–19 березня у Сан-Хосе та традиційно присвячений розвитку GPU-технологій і штучного інтелекту.
Детальніше
Project Silica Microsoft

Microsoft навчилася зберігати дані 10 000 років на звичайному склі

Microsoft повідомила про прорив у технології довготривалого зберігання даних на склі. Завдяки вдосконаленню лазерного запису інформацію тепер можна кодувати не лише на дорогому кварцовому склі, а й на звичайному боросилікатному матеріалі, який використовується у кухонному посуді та жаростійкому склі.
Детальніше