Gemini виграла понад $40 000 у покерному змаганні нейромереж

Google Gemini

У новому технологічному бенчмарку PokerBattle штучні інтелекти зіграли один проти одного в техаський холдем. Серед учасників — Gemini, GPT, Grok, DeepSeek та інші провідні моделі. Кожна система отримала стартовий банк у $100 000, а метою стало — обіграти конкурентів у серії реалістичних покерних сесій.

Як проходив експеримент

PokerBattle — це новий бенчмарк для оцінки стратегічного мислення та поведінки нейромереж, створений командою розробників із США. На відміну від звичних тестів на розуміння тексту чи логічних задач, тут штучні інтелекти змагаються у грі з неповною інформацією — покері, де успіх залежить не лише від розрахунку, а й від вміння читати суперника, блефувати та контролювати ризики.

Матчі проводилися у реальному часі, а глядачі могли спостерігати за перебігом гри з коментарями аналітиків. У протоколі зазначалися всі ключові дії: хто підвищував ставки, коли ШІ намагався блефувати, і як реагували інші учасники.

Результати: Gemini — лідер, GPT і Grok у трійці

За підсумками серії турнірів, Gemini випередила конкурентів із результатом понад +$40 000. На другому місці опинилася Grok, яка завершила гру з прибутком близько $24 000, а ChatGPT o3 посів третє місце, заробивши понад $22 000.

DeepSeek і кілька молодших моделей закінчили змагання в мінусі, продемонструвавши обережнішу або надто передбачувану поведінку.


Телеграм double.newsТелеграм double.news

Схожі Новини
iPhone Lockdown Mode

Apple заявила про відсутність зламів iPhone з увімкненим Режимом блокування

Apple заявила, що з моменту запуску функції Lockdown Mode у 2022 році не зафіксовано жодного успішного зламу пристроїв із увімкненим цим режимом. Йдеться про спеціальний рівень захисту, створений для протидії складним кібератакам, зокрема з використанням державного шпигунського програмного забезпечення.
Детальніше
Discrod

Масштабний збій інтернету: проблеми з Discord, X і ChatGPT

У п’ятницю, 27 березня 2026 року, користувачі по всьому світу зіткнулися з перебоями в роботі популярних онлайн-сервісів. Серед постраждалих — Discord, X (Twitter) і ChatGPT, а також низка інших платформ, які частково або повністю втратили доступність.
Детальніше
Windows 11 екран вимкнення

Windows виявився менш стабільним за macOS

У 2025 році корпоративні пристрої на базі Windows значно частіше стикалися з критичними збоями, ніж системи macOS. Про це йдеться у новому звіті компанії Omnissa, яка проаналізувала телеметрію мільйонів пристроїв у корпоративному середовищі.
Детальніше