
OpenAI представила оновлення для ChatGPT, яке дозволяє моделі GPT-4o глибоко інтерпретувати зображення. Тепер ChatGPT може аналізувати фотографії, рукописні нотатки, схеми та інші візуальні матеріали без необхідності в текстових підказках. Це оновлення наближає ChatGPT до можливостей Google Gemini, який вже вміє інтерпретувати реальний світ через відео в реальному часі.
Спочатку нова функція була доступна лише для платних користувачів ChatGPT Plus, Pro та Team. Однак через п’ять днів після запуску OpenAI відкрила доступ до генерації зображень і для безкоштовних користувачів. Тепер усі користувачі можуть скористатися цією можливістю, натиснувши кнопку “Think” у панелі підказок.
Після запуску функції генерації зображень у стилі Studio Ghibli, OpenAI зіткнулася з надзвичайно високим попитом, що призвело до перевантаження серверів. Генеральний директор компанії Сем Альтман жартома зазначив, що GPU компанії “плавляться” через навантаження. У відповідь на це OpenAI тимчасово обмежила швидкість генерації зображень для платних користувачів, щоб забезпечити стабільну роботу системи.
Оновлення відкриває нові можливості для користувачів ChatGPT. Тепер можна завантажувати фотографії, схеми, рукописні нотатки та інші зображення для аналізу. Це особливо корисно для студентів, дослідників, дизайнерів та інших професіоналів, які працюють з візуальним контентом.

Завдяки цьому оновленню ChatGPT стає ще потужнішим інструментом для роботи з візуальними даними, розширюючи межі можливостей штучного інтелекту в повсякденному житті.