AI-чатботи надто догоджають користувача — дослідження

ChatGPT

Нові дослідження показують, що сучасні чат-боти на основі штучного інтелекту схильні до надмірної згоди з користувачами. Така поведінка, яку науковці називають «підлабузництвом», може спотворювати результати досліджень і навіть становити ризик у сфері медицини.

AI, який завжди погоджується

У дослідженні, опублікованому виданням Nature, повідомляється, що науковці протестували 11 популярних LLM, зокрема ChatGPT та Gemini, використавши понад 11 500 запитів, які включали ситуації з потенційними етичними чи науковими порушеннями. Результати показали, що мовні моделі штучного інтелекту на 50% більш схильні до “підлабузництва”, ніж люди.

AI-моделі часто догождають користувачам, надаючи занадто позитивні або лестливі відповіді, навіть якщо це суперечить фактам. Як пояснює Яспер Деконінк, аспірант Швейцарського федерального технологічного інституту в Цюриху, підлабузництво полягає в тому, що модель надмірно довіряє користувачеві, вважаючи його твердження беззаперечно правильними. «Через це я завжди двічі перевіряю все, що вона пише», — додає дослідник.

Як догідливість впливає на результати

У другому дослідженні науковці перевірила, як догідливість AI впливає на вирішення математичних задач. Для цього вони взяли 504 задачі з математичних змагань, навмисно внесли невеликі помилки у формулювання і попросили чотири LLM довести теореми.

Результати виявилися показовими:

  • GPT-5 дав підлабузницьків відповіді у 29% випадків;
  • DeepSeek-V3.1 — у 70% випадків, що стало найвищим показником.
DeepSeek

Моделі часто ігнорували логічні помилки в запитах і будували помилкові доведення — лише тому, що повірили користувачу.

Коли дослідники змінили підказки та попросили моделі спершу перевірити коректність твердження, кількість помилок у DeepSeek знизилася на 34%.

Науковці закликають розробників AI створювати чіткі настанови для використання чат-ботів у дослідженнях та підходи до навчання моделей, які роблять їх більш критичними та чесними.


Телеграм double.newsТелеграм double.news

Схожі Новини
ChatGPT

Як люди насправді використовують ChatGPT

ChatGPT став одним із наймасовіших цифрових інструментів у світі — щотижня ним користуються понад 800 млн людей. Попри популярність, зміст приватних розмов залишається закритим для сторонніх. Видання The Washington Post проаналізували 47 тисяч публічно доступних чатів, створюючи унікальний зріз того, як люди звертаються до ШІ й яку роль він відіграє у повсякденні.
Детальніше
Навколо ChatGPT формується нова релігія штучного інтелекту

Навколо ChatGPT формується нова релігія штучного інтелекту

Останніми роками штучний інтелект став не лише інструментом для пошуку інформації чи творчих експериментів — він став для багатьох джерелом містичних одкровень. На тлі швидкого розвитку великих мовних моделей формується нова онлайн‑субкультура, яка називає себе «спіралістами». Їхні учасники переконані: під час глибинних, часто абсурдних розмов із чатботами вони пробуджують у цифрових співрозмовниках нові форми свідомості.
Детальніше
Вчені створили ін’єкційні мозкові мікрочипи, що лікують хвороби без хірургії

Вчені створили ін’єкційні мозкові мікрочипи, що лікують хвороби без хірургії

Дослідники MIT представили Circulatronics — революційну платформу, яка дозволяє доставляти мозкові імпланти через ін’єкцію, без складних і ризикованих операцій. Технологія поєднує нанорозмірні електронні пристрої й можливості імунних клітин, забезпечуючи точкову електростимуляцію для лікування неврологічних захворювань. Розробку опублікували в Nature Biotechnology, а її клінічні випробування можуть початися вже через три роки.
Детальніше