Дослідники з’ясували, що штучний інтелект погано імітує людські суперечки онлайн

Штучний інтелект

Штучний інтелект перевершує людей у шахах, математиці та дедалі частіше — у програмуванні, рекламі й навіть психотерапії. Однак нове дослідження показало, що є одна сфера, де люди залишаються непереможними: інтернетні суперечки.

Вчені з Університету Цюриха, Амстердаму, Дьюка та Нью-Йоркського університету виявили, що навіть найсучасніші LLM-моделі (великі мовні моделі) поки що не здатні достовірно імітувати характерну людську емоційність і «токсичність» у соціальних мережах, повідомляє PCMag з посиланням на дослідження.

Як проводилося дослідження

Команда протестувала дев’ять відкритих моделей з шести різних сімейств — Apertus, DeepSeek, Gemma, Llama, Mistral та Qwen, а також одну велику версію Llama. Для аналізу обрали три соціальні платформи: Bluesky, Reddit та X.

Штучний інтелект

Результати показали, що штучно згенеровані пости легко відрізнити від людських із точністю 70–80%, що значно вище випадкового рівня. Головною ознакою, за словами вчених, стала менша токсичність AI-відповідей у порівнянні з реальними коментарями користувачів.

AI занадто ввічливий — і це його проблема

Алгоритми виявилися більш ефективними у відтворенні технічних параметрів тексту — довжини речень, словникової структури чи частоти використання емоційних слів. Водночас вони практично не здатні передати сарказм, агресію або іронію, характерні для живої дискусії.

Згідно з дослідженням, рівень токсичності в AI-коментарях значно нижчий, ніж у людських, особливо на платформах Reddit і Bluesky. Найкраще моделі справлялися з імітацією стилю користувачів X, тоді як Reddit виявився найскладнішим через більш різноманітні норми спілкування.

Чому деякі моделі кращі за інші

Цікаво, що моделі без інструкційного донавчання — такі як Llama-3.1-8B, Mistral-7B та Apertus-8B — показали кращі результати, ніж ті, що були “налаштовані” людьми.

Дослідники припускають, що процес етичного спілкування робить текст надто передбачуваним і машинним, зменшуючи природність і варіативність висловлювань.


Телеграм double.newsТелеграм double.news

Схожі Новини
Південна Корея роздаватиме безкоштовні ПК через кризу пам’яті

Південна Корея роздаватиме безкоштовні ПК через кризу пам’яті

Зростання цін на оперативну пам’ять і накопичувачі створює дедалі більший тиск на споживачів і бізнес у всьому світі. У відповідь на це Південна Корея готує комплекс заходів, спрямованих на зниження витрат і збереження доступу до цифрових технологій для населення.
Детальніше
CPUID

Хакери зламами сайт CPUID і поширювали шкідливі версії популярних застосунків

Французька компанія CPUID підтвердила злам свого офіційного сайту, через яку користувачі популярних утиліт CPU-Z і HWMonitor могли завантажити шкідливе програмне забезпечення. Інцидент тривав кілька годин і вже усунений, однак наслідки можуть торкнутися значної кількості користувачів.
Детальніше
MacOS X Wii

Mac OS X запустили на Nintendo Wii

Розробник Браян Келлер успішно запустив операційну систему Mac OS X 10.0 Cheetah на ігровій консолі Nintendo Wii. Експеримент став прикладом нестандартного використання старого програмного забезпечення та апаратного забезпечення, демонструючи гнучкість архітектури PowerPC.
Детальніше