
У червні 2025 року інженер із Citrix Роберт Карузо влаштував шаховий матч між ChatGPT та емулятором останньої версії гри Video Chess для консолі Atari 2600 (1978). Результат: навіть на найпростіших налаштуваннях ChatGPT програв і «був абсолютно розгромлений». Про це пише PCMag.
Які були помилки AI
Карузо описав гру так:
«ChatGPT плутав тур із слоном, пропускав вилки пішаків та не міг відстежувати розташування фігур» .
Після цього модель пояснила поразку «абстрактністю піксельних іконок», проте і після переходу на стандартну шахову нотацію продовжувала допускати аналогічні помилки. Матч завершився зреченням ChatGPT приблизно через 90 хвилин.
Чому це перегралося?
Atari 2600 має неймовірно скромні технічні характеристики: процесор з частотою приблизно 1 MHz і менш ніж 128 байт оперативної пам’яті. Для порівняння, iPhone 15 Pro у понад 250 000 разів потужніший. А обчислювальні ресурси, що стоять за ChatGPT у хмарних дата-центрах OpenAI, взагалі перевищують можливості старої консолі на кілька порядків.
Водночас варто розуміти, що ChatGPT — це мовна модель, а не шаховий рушій. Вона не призначена для обробки логіки гри чи моделювання шахових позицій. Її сильна сторона — генерація тексту, а не точне розуміння правил ігрових систем.
Цей випадок став своєрідним прикладом переваги традиційних алгоритмів у спеціалізованих завданнях. Він чітко демонструє, що великі мовні моделі не завжди ефективні в умовах, які вимагають послідовної логіки та точного контролю над ігровим станом.
Реакція в спільноті
На Slashdot дискусію прокоментували так:
«ChatGPT не шаховий двигун… Якщо попросити випадкову людину зіткнутися з таким викликом — результат буде схожим» .
Дехто додав:
«Головна перевага ChatGPT — він працює на тексті, а не на розумінні шахів» .
Це обговорення підкреслює розрив між широкими мовними моделями і вузькоспеціалізованими алгоритмами, які фокусуються на певних завданнях.
Експеримент з Atari 2600 яскраво ілюструє обмеження мовних моделей: хоча AI здатен генерувати текст і давати корисні відповіді, у задачах, що вимагають чіткої логіки або моделювання стану (наприклад у шахах), класичні алгоритми залишаються ефективнішими.