Gemini виграла понад $40 000 у покерному змаганні нейромереж

Google Gemini

У новому технологічному бенчмарку PokerBattle штучні інтелекти зіграли один проти одного в техаський холдем. Серед учасників — Gemini, GPT, Grok, DeepSeek та інші провідні моделі. Кожна система отримала стартовий банк у $100 000, а метою стало — обіграти конкурентів у серії реалістичних покерних сесій.

Як проходив експеримент

PokerBattle — це новий бенчмарк для оцінки стратегічного мислення та поведінки нейромереж, створений командою розробників із США. На відміну від звичних тестів на розуміння тексту чи логічних задач, тут штучні інтелекти змагаються у грі з неповною інформацією — покері, де успіх залежить не лише від розрахунку, а й від вміння читати суперника, блефувати та контролювати ризики.

Матчі проводилися у реальному часі, а глядачі могли спостерігати за перебігом гри з коментарями аналітиків. У протоколі зазначалися всі ключові дії: хто підвищував ставки, коли ШІ намагався блефувати, і як реагували інші учасники.

Результати: Gemini — лідер, GPT і Grok у трійці

За підсумками серії турнірів, Gemini випередила конкурентів із результатом понад +$40 000. На другому місці опинилася Grok, яка завершила гру з прибутком близько $24 000, а ChatGPT o3 посів третє місце, заробивши понад $22 000.

DeepSeek і кілька молодших моделей закінчили змагання в мінусі, продемонструвавши обережнішу або надто передбачувану поведінку.


Телеграм double.newsТелеграм double.news

Схожі Новини
WhatsApp

Веб версія WhatsApp нарешті отримує голосові та відеодзвінки

Вебверсія WhatsApp, яка існує з 2015 року, вперше отримує повноцінну підтримку голосових і відеодзвінків. Функція вже почала поступово з’являтися у користувачів бета-версії WhatsApp Web і дозволяє здійснювати дзвінки без встановлення десктопного застосунку.
Детальніше
Spotify

Spotify вперше перевищив 750 мільйонів активних користувачів на місяць

Сервіс потокового аудіо Spotify оприлюднив фінансові результати за четвертий квартал 2025 року, зафіксувавши рекордне зростання аудиторії. Компанія завершила рік із 751 мільйоном щомісячних активних користувачів, що стало найвищим показником за всю історію платформи.
Детальніше
Штучний інтелект змушує працівників працювати швидше й довше

Штучний інтелект змушує працівників працювати швидше й довше

Попри поширену обіцянку, що штучний інтелект має зменшити рутину й звільнити час для важливіших завдань, нове дослідження показує протилежний ефект. Автори Harvard Business Review дійшли висновку, що впровадження генеративного ШІ не скорочує обсяг роботи, а системно посилює її інтенсивність.
Детальніше