Microsoft перевірила, як ШІ працює без людини

Microsoft AI

Microsoft провела масштабний експеримент, створивши штучне онлайн-середовище “Magentic Marketplace”, щоб дослідити, як ШІ-агенти діють без участі людини. Модель імітувала реальний інтернет-магазин, у якому агенти-покупці взаємодіяли з агентами-продавцями, виконуючи завдання торгівлі, переговорів і вибору товарів.

Як з’ясувалося, результати експерименту виявилися далекими від ідеалу — автономні моделі показали слабку здатність до ухвалення рішень, координації та самостійної роботи. Про це пише TechRadar.

Як працював експеримент “Magentic Marketplace”

За словами дослідників Microsoft, у тестовому середовищі діяли 100 покупців-агентів і 300 бізнес-агентів, які використовували передові моделі ШІ — GPT-4o, GPT-5 і Gemini-2.5-Flash.

Метою було перевірити, наскільки ефективно ШІ зможе діяти у складній ринковій екосистемі без втручання людини. Усі взаємодії відбувалися в симульованих умовах, а вихідний код платформи компанія опублікувала у відкритому доступі, щоб інші дослідники могли повторити експеримент або розширити його.

Що виявив експеримент Microsoft

Результати експерименту виявили низку суттєвих обмежень сучасних ШІ-моделей: покупці-агенти легко піддавалися впливу продавців, що свідчить про їхню вразливість до маніпуляцій. Коли кількість варіантів збільшувалася, ефективність рішень різко знижувалася, а під час колективних завдань системи не могли розподілити ролі між агентами, що призводило до хаотичної роботи. Ефективність моделей покращувалася лише за умови чітких покрокових інструкцій від людини.

“Без нагляду ШІ не впорається” — висновок Microsoft

Директорка Microsoft Research’s AI Frontiers Lab зазначила:

“Ми можемо давати моделям покрокові інструкції, але якщо ми тестуємо їхню здатність до співпраці, ці навички повинні бути в них спочатку”.

Вона підкреслила, що результати експерименту демонструють: нинішнім ШІ-агентам необхідна суттєва людська підтримка та контроль, особливо у багатокористувацьких або конкурентних середовищах.


Телеграм double.newsТелеграм double.news

Схожі Новини
ChatGPT

Журналіст вдалось «зламав» ChatGPT і Google AI за 20 хвилин

Журналіст BBC Томас Жермен продемонстрував, що змусити ChatGPT та Gemini від Google поширювати неправдиву інформацію можна буквально за кілька десятків хвилин. Для цього він використав простий SEO-прийом - створив вигадану статтю на власному сайті й дочекався, поки алгоритми її підхоплять.
Детальніше
samsung electronics

Samsung посилить захист від витоків перед запуском Galaxy S27

Samsung планує запровадити додаткові заходи безпеки, щоб обмежити витоки інформації щодо майбутньої лінійки Samsung Galaxy S27. За даними південнокорейських медіа, виробник уже оновлює внутрішні інструменти комунікації, щоб зменшити ризик передчасного розголошення характеристик і дизайну флагманських смартфонів.
Детальніше
ChatGPT

Студент подав до суду на OpenAI, звинувативши ChatGPT у психологічній шкоді

У штаті Джорджія студент коледжу подав позов проти OpenAI, стверджуючи, що версія чат-бота ChatGPT переконала його в особливій «місії» та сприяла розвитку психотичного епізоду. Позов подано до суду Сан-Дієго наприкінці січня 2026 року.
Детальніше