Microsoft перевірила, як ШІ працює без людини

Microsoft AI

Microsoft провела масштабний експеримент, створивши штучне онлайн-середовище “Magentic Marketplace”, щоб дослідити, як ШІ-агенти діють без участі людини. Модель імітувала реальний інтернет-магазин, у якому агенти-покупці взаємодіяли з агентами-продавцями, виконуючи завдання торгівлі, переговорів і вибору товарів.

Як з’ясувалося, результати експерименту виявилися далекими від ідеалу — автономні моделі показали слабку здатність до ухвалення рішень, координації та самостійної роботи. Про це пише TechRadar.

Як працював експеримент “Magentic Marketplace”

За словами дослідників Microsoft, у тестовому середовищі діяли 100 покупців-агентів і 300 бізнес-агентів, які використовували передові моделі ШІ — GPT-4o, GPT-5 і Gemini-2.5-Flash.

Метою було перевірити, наскільки ефективно ШІ зможе діяти у складній ринковій екосистемі без втручання людини. Усі взаємодії відбувалися в симульованих умовах, а вихідний код платформи компанія опублікувала у відкритому доступі, щоб інші дослідники могли повторити експеримент або розширити його.

Що виявив експеримент Microsoft

Результати експерименту виявили низку суттєвих обмежень сучасних ШІ-моделей: покупці-агенти легко піддавалися впливу продавців, що свідчить про їхню вразливість до маніпуляцій. Коли кількість варіантів збільшувалася, ефективність рішень різко знижувалася, а під час колективних завдань системи не могли розподілити ролі між агентами, що призводило до хаотичної роботи. Ефективність моделей покращувалася лише за умови чітких покрокових інструкцій від людини.

“Без нагляду ШІ не впорається” — висновок Microsoft

Директорка Microsoft Research’s AI Frontiers Lab зазначила:

“Ми можемо давати моделям покрокові інструкції, але якщо ми тестуємо їхню здатність до співпраці, ці навички повинні бути в них спочатку”.

Вона підкреслила, що результати експерименту демонструють: нинішнім ШІ-агентам необхідна суттєва людська підтримка та контроль, особливо у багатокористувацьких або конкурентних середовищах.


Телеграм double.newsТелеграм double.news

Схожі Новини
Найкращі смартфони 2025 року

Найкращі смартфони 2025 року за версією блогера MKBHD

Грудень традиційно приносить із собою огляди року, і 2025-й став справді багатим на технологічні прориви у сфері смартфонів. YouTube-блогер Маркес Браунлі (MKBHD), один із найавторитетніших оглядачів мобільної техніки, оприлюднив переможців премії Smartphone Awards 2025, яка охоплює десять категорій — від дизайну до автономності.
Детальніше
Google Gemini

Google спростувала чутки про запуск реклами в Gemini AI

Попри нещодавні повідомлення ЗМІ про можливу появу реклами в Gemini AI у 2026 році, Google офіційно спростувала ці заяви. Представник компанії підтвердив, що в додатку Gemini немає реклами, і наразі немає планів її додавати.
Детальніше
Чорна Діра

Астрономи виявили об’єкти, які виживають поблизу надмасивної чорної діри в центрі Чумацького Шляху

У самому серці нашої галактики, Чумацького Шляху, розташована надмасивна чорна діра масою близько 4 мільйонів сонць. Попри її колосальну силу, яка здатна розривати на частини зірки, планети й міжзоряні хмари, астрономи виявили, що деякі небесні об’єкти не лише наближаються до неї, але й виживають.
Детальніше