OpenAI випустила GPT-5.2: нову модель для професійної роботи, коду та агентів

ChatGPT

OpenAI оголосила про запуск GPT-5.2 – продовження серії мовних моделей, що вже змінила уявлення про можливості ШІ. Новинка доступна у трьох версіях: Instant, Thinking та Pro, які поступово з’являються для користувачів ChatGPT Plus, Enterprise, Business, а також для розробників через API.

За словами розробників, GPT-5.2 є суттєвим проривом у розвитку загального штучного інтелекту: модель краще розуміє довгі контексти, точніше генерує код і ефективніше виконує складні багатокрокові завдання завдяки вдосконаленим агентним можливостям.

GPT-5.2 вперше перевершила експертів-людей

Головним досягненням моделі став прорив у GDPval – новому еталонному тесті, який оцінює компетентність у 44 професіях. За результатами сліпих порівнянь, GPT-5.2 Thinking перевершила або зрівнялася з фахівцями у 70,9% випадків.

GPT-5.2 Thinking успішно впоралася із завданнями зі створення складних електронних таблиць, розробки презентацій та написання технічної документації, виконуючи їх більш ніж у 11 разів швидше та менш ніж за 1% вартості, порівняно з роботою фахівців-людей.

Покращення для розробників і технічних фахівців

У тесті SWE-Bench Pro, що оцінює реальні навички програмної інженерії, GPT-5.2 Thinking досягла нового рекорду у 55,6%. Це свідчить про здатність моделі працювати з багатьма мовами програмування та складними кодовими базами.

GPT-5.2 отримала покращені візуальні можливості: модель майже вдвічі зменшила кількість помилок при аналізі графіків і схем, точніше розпізнає дашборди, макети та скріншоти, а також краще інтерпретує технічні об’єкти на зразок материнських плат. Також вона на 30% рідше генерує вигадані факти, що підвищує її надійність.

Довгий контекст і глибоке міркування

Ще одним важливим оновленням стала здатність моделі до long-horizon reasoning – довготривалого логічного мислення. У бенчмарку MRCRv2 GPT-5.2 Thinking досягла майже 100% точності при роботі з документами обсягом до 256 000 токенів.

Порівняння з попередником і перші інтеграції

У порівнянні з GPT-5.1, нова версія демонструє суттєве покращення у всіх ключових метриках. Уже кілька технологічних компаній, серед яких Notion, Zoom, Shopify та Databricks, інтегрували GPT-5.2 у свої продукти.

Вони відзначили високу ефективність в агентних завданнях, де ШІ може автономно виконувати багатоетапні проєкти, використовуючи внутрішні інструменти.

Конкуренція з Google Gemini 3

Запуск GPT-5.2 став відповіддю на активізацію конкуренції з боку Google, яка в листопаді презентувала Gemini 3 – нову ШІ-платформу, що лідирує в галузевих рейтингах.

Генеральний директор OpenAI Сем Альтман підтвердив в інтерв’ю CNBC, що оголосив внутрішній “code red”, щоб прискорити розробку нової моделі. При цьому Альтман зауважив, що реальний вплив Gemini 3 на метрики OpenAI виявився меншим, ніж очікувалося.


Телеграм double.newsТелеграм double.news

Схожі Новини
СЕО Nvidia Дженсен Хуанг

CEO Nvidia розкритикував апокаліптичні сценарії розвитку ШІ

Генеральний директор Nvidia Дженсен Хуанг публічно виступив проти страхів навколо так званого «божественного ШІ». Під час подкасту No Priors він заявив, що апокаліптичні сценарії шкодять індустрії штучного інтелекту, суспільству та державній політиці, а створення «всемогущого AI» не має жодних реалістичних передумов у найближчому майбутньому.
Детальніше
Хакер

Базу даних хакерського форуму зламали: витекли 324 тисячі акаунтів

Відомий хакерський майданчик BreachForums сам став жертвою масштабного зламу. У результаті атаки було скомпрометовано близько 324 тисяч облікових записів, частина з яких містила публічні IP-адреси, потенційно придатні для ідентифікації користувачів правоохоронними органами.
Детальніше
Ілон Маск

Ілон Маск висловив занепокоєння партнерством Apple і Google щодо Siri

Ілон Маск публічно висловив занепокоєння співпрацею Apple та Google у сфері штучного інтелекту. На його думку, використання платформи Gemini для оновленої версії Siri може призвести до надмірної концентрації впливу в руках Google.
Детальніше