xAI звинувачують у маніпуляціях з бенчмарками Grok-3

xAI

У лютому 2025 року компанія xAI представила Grok-3 — штучний інтелект нового покоління, який, за словами компанії, перевершує конкурентів, зокрема OpenAI та DeepSeek, у тестах з математики, науки та програмування. Представники xAI заявили, що їхня модель є “найрозумнішою AI-системою на ринку”.

Однак співробітник OpenAI, який побажав залишитися анонімним, звинуватив xAI у маніпуляціях із результатами бенчмарків. Він стверджує, що дані, оприлюднені xAI, не відповідають незалежним тестам та можуть вводити користувачів в оману. Це викликало хвилю обговорень у сфері штучного інтелекту щодо прозорості методів оцінки AI-моделей.

Експерти закликають до незалежних перевірок результатів та стандартизованих методів оцінки, щоб уникнути подібних ситуацій у майбутньому. Станом на зараз xAI не надала офіційних коментарів щодо цих звинувачень.


Телеграм double.newsТелеграм double.news

Схожі Новини
Google Microsoft Amazon Meta

Інвестиції у штучний інтелект можуть перевищити $3 трлн у найближчі роки

Світові технологічні гіганти активно інвестують у розвиток штучного інтелекту, і масштаби цих вкладень уже досягли рекордних значень. Як повідомляє Fortune, інвестиції у сферу AI протягом найближчих років можуть перевищити $3 трлн, що робить нинішній технологічний цикл одним із найбільших в історії.
Детальніше
ChatGPT

ChatGPT знову очолив App Store після скандалу з контрактом Міноборони США

Мобільний застосунок ChatGPT повернувся на перше місце в рейтингу App Store у США після короткочасного падіння, спричиненого критикою угоди між OpenAI та Міністерством оборони США.
Детальніше
Microsoft CEO Xbox

Microsoft: ідентичність Xbox — це ігри, і компанія продовжить інвестувати в геймінг

Генеральний директор Microsoft Сатья Наделла заявив, що компанія і надалі активно інвестуватиме в ігрову індустрію. Під час внутрішньої сесії запитань і відповідей із новою керівницею Xbox Ашою Шарма він підкреслив, що ігри залишаються важливою частиною ідентичності Microsoft.
Детальніше