
OpenAI оголосила про запуск GPT-5.2 – продовження серії мовних моделей, що вже змінила уявлення про можливості ШІ. Новинка доступна у трьох версіях: Instant, Thinking та Pro, які поступово з’являються для користувачів ChatGPT Plus, Enterprise, Business, а також для розробників через API.
За словами розробників, GPT-5.2 є суттєвим проривом у розвитку загального штучного інтелекту: модель краще розуміє довгі контексти, точніше генерує код і ефективніше виконує складні багатокрокові завдання завдяки вдосконаленим агентним можливостям.
GPT-5.2 вперше перевершила експертів-людей
Головним досягненням моделі став прорив у GDPval – новому еталонному тесті, який оцінює компетентність у 44 професіях. За результатами сліпих порівнянь, GPT-5.2 Thinking перевершила або зрівнялася з фахівцями у 70,9% випадків.
GPT-5.2 Thinking успішно впоралася із завданнями зі створення складних електронних таблиць, розробки презентацій та написання технічної документації, виконуючи їх більш ніж у 11 разів швидше та менш ніж за 1% вартості, порівняно з роботою фахівців-людей.

Покращення для розробників і технічних фахівців
У тесті SWE-Bench Pro, що оцінює реальні навички програмної інженерії, GPT-5.2 Thinking досягла нового рекорду у 55,6%. Це свідчить про здатність моделі працювати з багатьма мовами програмування та складними кодовими базами.
GPT-5.2 отримала покращені візуальні можливості: модель майже вдвічі зменшила кількість помилок при аналізі графіків і схем, точніше розпізнає дашборди, макети та скріншоти, а також краще інтерпретує технічні об’єкти на зразок материнських плат. Також вона на 30% рідше генерує вигадані факти, що підвищує її надійність.

Довгий контекст і глибоке міркування
Ще одним важливим оновленням стала здатність моделі до long-horizon reasoning – довготривалого логічного мислення. У бенчмарку MRCRv2 GPT-5.2 Thinking досягла майже 100% точності при роботі з документами обсягом до 256 000 токенів.
Порівняння з попередником і перші інтеграції
У порівнянні з GPT-5.1, нова версія демонструє суттєве покращення у всіх ключових метриках. Уже кілька технологічних компаній, серед яких Notion, Zoom, Shopify та Databricks, інтегрували GPT-5.2 у свої продукти.
Вони відзначили високу ефективність в агентних завданнях, де ШІ може автономно виконувати багатоетапні проєкти, використовуючи внутрішні інструменти.
Конкуренція з Google Gemini 3
Запуск GPT-5.2 став відповіддю на активізацію конкуренції з боку Google, яка в листопаді презентувала Gemini 3 – нову ШІ-платформу, що лідирує в галузевих рейтингах.
Генеральний директор OpenAI Сем Альтман підтвердив в інтерв’ю CNBC, що оголосив внутрішній “code red”, щоб прискорити розробку нової моделі. При цьому Альтман зауважив, що реальний вплив Gemini 3 на метрики OpenAI виявився меншим, ніж очікувалося.

