xAI звинувачують у маніпуляціях з бенчмарками Grok-3

xAI

У лютому 2025 року компанія xAI представила Grok-3 — штучний інтелект нового покоління, який, за словами компанії, перевершує конкурентів, зокрема OpenAI та DeepSeek, у тестах з математики, науки та програмування. Представники xAI заявили, що їхня модель є “найрозумнішою AI-системою на ринку”.

Однак співробітник OpenAI, який побажав залишитися анонімним, звинуватив xAI у маніпуляціях із результатами бенчмарків. Він стверджує, що дані, оприлюднені xAI, не відповідають незалежним тестам та можуть вводити користувачів в оману. Це викликало хвилю обговорень у сфері штучного інтелекту щодо прозорості методів оцінки AI-моделей.

Експерти закликають до незалежних перевірок результатів та стандартизованих методів оцінки, щоб уникнути подібних ситуацій у майбутньому. Станом на зараз xAI не надала офіційних коментарів щодо цих звинувачень.


Телеграм double.news
Схожі Новини
Xbox Stream Your Own Games

Xbox дозволяє стрімити власні ігри з консолі на ПК: нова функція для користувачів Game Pass Ultimate

Microsoft розширила можливості хмарного геймінгу — тепер учасники Xbox Insider з підпискою Game Pass Ultimate можуть транслювати свої власні ігри з консолі прямо на ПК через додаток Xbox. Нова функція доступна в 28 країнах, де підтримується Xbox Cloud Gaming.
Детальніше
Google

Google Discover впроваджує AI-резюме — видавці б’ють на сполох через падіння трафіку

У новому оновленні застосунку Google Discover на iOS та Android користувачі бачитимуть не заголовки новинних сайтів, а автоматично згенеровані резюме від штучного інтелекту, що може ще більше скоротити переходи на сторінки медіа.
Детальніше