Дослідники з’ясували, що штучний інтелект погано імітує людські суперечки онлайн

Штучний інтелект

Штучний інтелект перевершує людей у шахах, математиці та дедалі частіше — у програмуванні, рекламі й навіть психотерапії. Однак нове дослідження показало, що є одна сфера, де люди залишаються непереможними: інтернетні суперечки.

Вчені з Університету Цюриха, Амстердаму, Дьюка та Нью-Йоркського університету виявили, що навіть найсучасніші LLM-моделі (великі мовні моделі) поки що не здатні достовірно імітувати характерну людську емоційність і «токсичність» у соціальних мережах, повідомляє PCMag з посиланням на дослідження.

Як проводилося дослідження

Команда протестувала дев’ять відкритих моделей з шести різних сімейств — Apertus, DeepSeek, Gemma, Llama, Mistral та Qwen, а також одну велику версію Llama. Для аналізу обрали три соціальні платформи: Bluesky, Reddit та X.

Штучний інтелект

Результати показали, що штучно згенеровані пости легко відрізнити від людських із точністю 70–80%, що значно вище випадкового рівня. Головною ознакою, за словами вчених, стала менша токсичність AI-відповідей у порівнянні з реальними коментарями користувачів.

AI занадто ввічливий — і це його проблема

Алгоритми виявилися більш ефективними у відтворенні технічних параметрів тексту — довжини речень, словникової структури чи частоти використання емоційних слів. Водночас вони практично не здатні передати сарказм, агресію або іронію, характерні для живої дискусії.

Згідно з дослідженням, рівень токсичності в AI-коментарях значно нижчий, ніж у людських, особливо на платформах Reddit і Bluesky. Найкраще моделі справлялися з імітацією стилю користувачів X, тоді як Reddit виявився найскладнішим через більш різноманітні норми спілкування.

Чому деякі моделі кращі за інші

Цікаво, що моделі без інструкційного донавчання — такі як Llama-3.1-8B, Mistral-7B та Apertus-8B — показали кращі результати, ніж ті, що були “налаштовані” людьми.

Дослідники припускають, що процес етичного спілкування робить текст надто передбачуваним і машинним, зменшуючи природність і варіативність висловлювань.


Телеграм double.newsТелеграм double.news

Схожі Новини
Американський стартап хоче живити сонячні ферми лазерами з орбіти

Американський стартап хоче живити сонячні ферми лазерами з орбіти

Компанія Overview Energy з США представила амбітний план забезпечити безперервне живлення сонячних електростанцій — навіть у темну пору доби. Стартап пропонує використовувати супутники на геостаціонарній орбіті для збору сонячної енергії, яка потім передаватиметься на Землю у вигляді інфрачервоних лазерних променів.
Детальніше
Samsung

Samsung працює над новою камерою, якою зацікавилася Apple

Samsung розробляє інноваційний сенсор з глобальним затвором для смартфонів — і Apple уже вивчає можливості його застосування в майбутніх iPhone. Ця технологія може стати наступним кроком у змаганні за якість мобільної фотографії.
Детальніше
Grok

Хакери використовують ChatGPT, Grok і Google для поширення шкідливого вірусу

Хакери знайшли спосіб використати популярні AI-чат-боти ChatGPT, Grok і пошук Google для поширення шкідливих інструкцій, які дозволяють встановити зловмисне ПЗ на комп’ютери користувачів.
Детальніше