
ChatGPT тепер отримав можливість не лише відповідати на запити, а й діяти. За допомогою так званого “агентного режиму” (agent mode), штучний інтелект може самостійно:
- переходити на сайти, натискати кнопки, вводити текст;
- аналізувати документи й створювати презентації;
- працювати з API та виконувати код у терміналі;
- синхронізуватися з Gmail, Google Calendar, GitHub та іншими сервісами.
Це стало можливим завдяки поєднанню трьох ключових технологій OpenAI: можливостей глибокого аналізу, навігації в браузері (Operator) та мовного інтерфейсу ChatGPT.
Як це працює
Модель використовує власний віртуальний комп’ютер для збереження контексту завдань і комбінує кілька інструментів:
- Візуальний браузер — для роботи з вебінтерфейсами;
- Текстовий браузер — для швидкого аналізу тексту;
- Термінал — для виконання скриптів;
- Доступ до API — для взаємодії з зовнішніми сервісами.
Завдяки цьому ChatGPT може виконувати завдання від початку до кінця без участі користувача — але з постійним контролем: перед важливими діями модель запитує підтвердження.
Хто вже має доступ
Функція вже доступна користувачам ChatGPT Pro, Plus та Team. У найближчі тижні її отримають також бізнес-клієнти та освітні установи. Активація здійснюється через меню інструментів у вікні чату — достатньо обрати “agent mode”.