xAI звинувачують у маніпуляціях з бенчмарками Grok-3

xAI

У лютому 2025 року компанія xAI представила Grok-3 — штучний інтелект нового покоління, який, за словами компанії, перевершує конкурентів, зокрема OpenAI та DeepSeek, у тестах з математики, науки та програмування. Представники xAI заявили, що їхня модель є “найрозумнішою AI-системою на ринку”.

Однак співробітник OpenAI, який побажав залишитися анонімним, звинуватив xAI у маніпуляціях із результатами бенчмарків. Він стверджує, що дані, оприлюднені xAI, не відповідають незалежним тестам та можуть вводити користувачів в оману. Це викликало хвилю обговорень у сфері штучного інтелекту щодо прозорості методів оцінки AI-моделей.

Експерти закликають до незалежних перевірок результатів та стандартизованих методів оцінки, щоб уникнути подібних ситуацій у майбутньому. Станом на зараз xAI не надала офіційних коментарів щодо цих звинувачень.

Схожі Новини
Xiaomi HyperOS

Xiaomi може пропустити HyperOS 3 і перейти одразу до HyperOS 26, слідом за прикладом Apple

Революційне рішення Apple — замінити iOS 19 на iOS 26 — вплинуло не лише на користувачів, а й на конкурентів. Така стратегія, за якою номер програмного забезпечення відповідає року його основного використання, вже може стати стандартом для галузі. Xiaomi, за інформацією з джерел галузі, також розглядає перехід від HyperOS 2 одразу до HyperOS 26, пропускаючи версію 3.
Детальніше