Технології

Вчені зі Стенфорда з’ясували: з часом GPT-4 “тупіє”

21.07.2023

Нове дослідження вчених зі Стенфордського університету підтвердило думку, яку вже кілька тижнів висловлюють користувачі Інтернету: ChatGPT Plus, створений на базі GPT-4, дійсно став менш інтелектуальним, на відміну від GPT-3.5, який використовується в безкоштовній версії чат-бота.

У своїй роботі вчені порівнювали відповіді чат-бота, який працює на базі GPT-4 та GPT-3.5, на різні запити. Вони виявили, що поведінка чат-бота та точність відповідей на деякі запити в новій версії значно погіршились.

Учені аналізували мовні моделі GPT-4 та GPT-3.5, які були випущені у березні та січні відповідно. Вони виявили, що за цей час точність GPT-4 суттєво знизилась, тоді як у GPT-3.5, навпаки, покращилась.

Наприклад, точність відповіді на питання, чи є 17077 простим числом, впала на 95,2% – тоді як у GPT-3.5 вона, навпаки, зросла з 7,4% до 86,8%. Також знизилась ймовірність успішного виконання коду, написаного нейромережею, в актуальних версіях обох моделей.

Раніше віце-президент OpenAI Пітер Веліндер вже відповідав на звинувачення користувачів ChatGPT Plus:

“Ні, ми не зробили GPT-4 глупішим. Ми робимо кожну нову версію розумнішою за попередню. Зараз у нас є така гіпотеза: коли ви активніше використовуєте щось, ви починаєте помічати проблеми, яких раніше не бачили“.

У відповідь на цей твіт Веліндер попросив надати докази того, що чат-бот став працювати гірше. Дослідження від стенфордських вчених з’явилося через 5 днів після цього – і відповідь від OpenAI поки що не наступила.

Це вже не перший раз, коли GPT-4 звинувачують у наданні неправдивої інформації. У березні аналітики NewsGuard виявили, що ChatGPT, заснований на GPT-4, легше можна навчити говорити неправду – тоді як сама OpenAI говорить про збільшення точності відповідей на 40% у порівнянні з GPT-3.5. Зокрема, у тестах NewsGuard нова версія нейромережі рідше спростовувала недостовірні відомості – включаючи неправдиві дані про сучасні події та теорії змови.

Схожі Новини

Технології

Windows 11 отримає вбудований тест швидкості інтернету в панелі завдань

Microsoft анонсувала нову функцію для Windows 11 - вбудований тест швидкості інтернету, який з’явиться прямо в панелі завдань. Оновлення вже доступне учасникам програми Windows Insider та найближчими тижнями стане частиною стабільного релізу.

14 години тому

Детальніше

Технології

Google анонсували I/O 2026: Android 17 та оновлення Gemini

Google офіційно підтвердила проведення щорічної конференції для розробників Google I/O 2026. Захід відбудеться 19–20 травня та стане головною платформою для презентації Android 17, оновлень штучного інтелекту Gemini та інших технологічних новинок.

15 години тому

Детальніше

Windows 11 отримає вбудований тест швидкості інтернету в панелі завдань

Google анонсували I/O 2026: Android 17 та оновлення Gemini

Кріс Гемсворт натякнув на продовження Тор 5 після Месників: Сходження Доктора Дума

Популярні Теги

Вчені зі Стенфорда з’ясували: з часом GPT-4 “тупіє”