AI-чатботи надто догоджають користувача — дослідження

ChatGPT

Нові дослідження показують, що сучасні чат-боти на основі штучного інтелекту схильні до надмірної згоди з користувачами. Така поведінка, яку науковці називають «підлабузництвом», може спотворювати результати досліджень і навіть становити ризик у сфері медицини.

AI, який завжди погоджується

У дослідженні, опублікованому виданням Nature, повідомляється, що науковці протестували 11 популярних LLM, зокрема ChatGPT та Gemini, використавши понад 11 500 запитів, які включали ситуації з потенційними етичними чи науковими порушеннями. Результати показали, що мовні моделі штучного інтелекту на 50% більш схильні до “підлабузництва”, ніж люди.

AI-моделі часто догождають користувачам, надаючи занадто позитивні або лестливі відповіді, навіть якщо це суперечить фактам. Як пояснює Яспер Деконінк, аспірант Швейцарського федерального технологічного інституту в Цюриху, підлабузництво полягає в тому, що модель надмірно довіряє користувачеві, вважаючи його твердження беззаперечно правильними. «Через це я завжди двічі перевіряю все, що вона пише», — додає дослідник.

Як догідливість впливає на результати

У другому дослідженні науковці перевірила, як догідливість AI впливає на вирішення математичних задач. Для цього вони взяли 504 задачі з математичних змагань, навмисно внесли невеликі помилки у формулювання і попросили чотири LLM довести теореми.

Результати виявилися показовими:

  • GPT-5 дав підлабузницьків відповіді у 29% випадків;
  • DeepSeek-V3.1 — у 70% випадків, що стало найвищим показником.
DeepSeek

Моделі часто ігнорували логічні помилки в запитах і будували помилкові доведення — лише тому, що повірили користувачу.

Коли дослідники змінили підказки та попросили моделі спершу перевірити коректність твердження, кількість помилок у DeepSeek знизилася на 34%.

Науковці закликають розробників AI створювати чіткі настанови для використання чат-ботів у дослідженнях та підходи до навчання моделей, які роблять їх більш критичними та чесними.


Телеграм double.newsТелеграм double.news

Схожі Новини
iPhone Lockdown Mode

Apple заявила про відсутність зламів iPhone з увімкненим Режимом блокування

Apple заявила, що з моменту запуску функції Lockdown Mode у 2022 році не зафіксовано жодного успішного зламу пристроїв із увімкненим цим режимом. Йдеться про спеціальний рівень захисту, створений для протидії складним кібератакам, зокрема з використанням державного шпигунського програмного забезпечення.
Детальніше
Discrod

Масштабний збій інтернету: проблеми з Discord, X і ChatGPT

У п’ятницю, 27 березня 2026 року, користувачі по всьому світу зіткнулися з перебоями в роботі популярних онлайн-сервісів. Серед постраждалих — Discord, X (Twitter) і ChatGPT, а також низка інших платформ, які частково або повністю втратили доступність.
Детальніше
Windows 11 екран вимкнення

Windows виявився менш стабільним за macOS

У 2025 році корпоративні пристрої на базі Windows значно частіше стикалися з критичними збоями, ніж системи macOS. Про це йдеться у новому звіті компанії Omnissa, яка проаналізувала телеметрію мільйонів пристроїв у корпоративному середовищі.
Детальніше