Вчені зі Стенфорда з’ясували: з часом GPT-4 “тупіє”


Нове дослідження вчених зі Стенфордського університету підтвердило думку, яку вже кілька тижнів висловлюють користувачі Інтернету: ChatGPT Plus, створений на базі GPT-4, дійсно став менш інтелектуальним, на відміну від GPT-3.5, який використовується в безкоштовній версії чат-бота.

У своїй роботі вчені порівнювали відповіді чат-бота, який працює на базі GPT-4 та GPT-3.5, на різні запити. Вони виявили, що поведінка чат-бота та точність відповідей на деякі запити в новій версії значно погіршились.

Учені аналізували мовні моделі GPT-4 та GPT-3.5, які були випущені у березні та січні відповідно. Вони виявили, що за цей час точність GPT-4 суттєво знизилась, тоді як у GPT-3.5, навпаки, покращилась.

Наприклад, точність відповіді на питання, чи є 17077 простим числом, впала на 95,2% – тоді як у GPT-3.5 вона, навпаки, зросла з 7,4% до 86,8%. Також знизилась ймовірність успішного виконання коду, написаного нейромережею, в актуальних версіях обох моделей.

Раніше віце-президент OpenAI Пітер Веліндер вже відповідав на звинувачення користувачів ChatGPT Plus:

Ні, ми не зробили GPT-4 глупішим. Ми робимо кожну нову версію розумнішою за попередню. Зараз у нас є така гіпотеза: коли ви активніше використовуєте щось, ви починаєте помічати проблеми, яких раніше не бачили“.

У відповідь на цей твіт Веліндер попросив надати докази того, що чат-бот став працювати гірше. Дослідження від стенфордських вчених з’явилося через 5 днів після цього – і відповідь від OpenAI поки що не наступила.

Це вже не перший раз, коли GPT-4 звинувачують у наданні неправдивої інформації. У березні аналітики NewsGuard виявили, що ChatGPT, заснований на GPT-4, легше можна навчити говорити неправду – тоді як сама OpenAI говорить про збільшення точності відповідей на 40% у порівнянні з GPT-3.5. Зокрема, у тестах NewsGuard нова версія нейромережі рідше спростовувала недостовірні відомості – включаючи неправдиві дані про сучасні події та теорії змови.


Телеграм double.newsТелеграм double.news

Схожі Новини
Вірус

У США ексспівробітники кібербезпеки використали вірус для вимагання $1,2 млн

У США двоє колишніх працівників компаній у сфері кібербезпеки визнали себе винними у здійсненні серії ransomware-атак, які відбулися у 2023 році. За даними Міністерство юстиції США, зловмисники використали шкідливе ПЗ ALPHV / BlackCat і вимагали викуп у біткоїнах на суму понад 1,2 мільйона доларів.
Детальніше
Disney

Disney заплатить $10 млн за порушення правил захисту даних дітей на YouTube

Disney погодилася виплатити 10 мільйонів доларів цивільного штрафу після звинувачень у порушенні федерального законодавства США щодо захисту персональних даних дітей. Йдеться про неправильно маркований дитячий контент на YouTube, що, за версією влади, призвело до незаконного збору даних та показу таргетованої реклами.
Детальніше
iPhone 17 Pro Max

Користувачі iPhone 17 Pro скаржаться на шипіння динаміка під час заряджання

Після виходу нових смартфонів Apple традиційно з’являються поодинокі скарги на програмні або апаратні нюанси. Цього разу частина власників iPhone 17 Pro та iPhone 17 Pro Max повідомляє про незвичну проблему - сторонній шум або шипіння з динаміків під час заряджання пристрою.
Детальніше