Стара консоль Atari перемогла ChatGPT у шахах: AI не впорався з класикою 1978 року

Atari

У червні 2025 року інженер із Citrix Роберт Карузо влаштував шаховий матч між ChatGPT та емулятором останньої версії гри Video Chess для консолі Atari 2600 (1978). Результат: навіть на найпростіших налаштуваннях ChatGPT програв і «був абсолютно розгромлений». Про це пише PCMag.

Які були помилки AI

Карузо описав гру так:

«ChatGPT плутав тур із слоном, пропускав вилки пішаків та не міг відстежувати розташування фігур» .

Після цього модель пояснила поразку «абстрактністю піксельних іконок», проте і після переходу на стандартну шахову нотацію продовжувала допускати аналогічні помилки. Матч завершився зреченням ChatGPT приблизно через 90 хвилин.

Чому це перегралося?

Atari 2600 має неймовірно скромні технічні характеристики: процесор з частотою приблизно 1 MHz і менш ніж 128 байт оперативної пам’яті. Для порівняння, iPhone 15 Pro у понад 250 000 разів потужніший. А обчислювальні ресурси, що стоять за ChatGPT у хмарних дата-центрах OpenAI, взагалі перевищують можливості старої консолі на кілька порядків.

Водночас варто розуміти, що ChatGPT — це мовна модель, а не шаховий рушій. Вона не призначена для обробки логіки гри чи моделювання шахових позицій. Її сильна сторона — генерація тексту, а не точне розуміння правил ігрових систем.

Цей випадок став своєрідним прикладом переваги традиційних алгоритмів у спеціалізованих завданнях. Він чітко демонструє, що великі мовні моделі не завжди ефективні в умовах, які вимагають послідовної логіки та точного контролю над ігровим станом.

Реакція в спільноті

На Slashdot дискусію прокоментували так:

«ChatGPT не шаховий двигун… Якщо попросити випадкову людину зіткнутися з таким викликом — результат буде схожим» .

Дехто додав:

«Головна перевага ChatGPT — він працює на тексті, а не на розумінні шахів» .

Це обговорення підкреслює розрив між широкими мовними моделями і вузькоспеціалізованими алгоритмами, які фокусуються на певних завданнях.

Експеримент з Atari 2600 яскраво ілюструє обмеження мовних моделей: хоча AI здатен генерувати текст і давати корисні відповіді, у задачах, що вимагають чіткої логіки або моделювання стану (наприклад у шахах), класичні алгоритми залишаються ефективнішими.


Телеграм double.newsТелеграм double.news

Схожі Новини
SpaceX

SpaceX розкрила причини невдач Starship і готується до нового запуску

SpaceX завершила розслідування попередніх аварій Starship і отримала дозвіл від Федерального управління авіації США (FAA) на проведення десятого випробувального польоту. Запуск Flight 10 попередньо запланований на 24 серпня з майданчика Starbase у Техасі.
Детальніше
Процесор AMD

Частка AMD на ринку настільних процесорів досягла історичного максимуму

AMD впевнено зміцнює свої позиції на ринку настільних процесорів. За підсумками другого кварталу 2025 року, частка компанії в постачаннях CPU зросла до 32.2%, тоді як рік тому вона становила лише 23%.
Детальніше