xAI звинувачують у маніпуляціях з бенчмарками Grok-3

xAI

У лютому 2025 року компанія xAI представила Grok-3 — штучний інтелект нового покоління, який, за словами компанії, перевершує конкурентів, зокрема OpenAI та DeepSeek, у тестах з математики, науки та програмування. Представники xAI заявили, що їхня модель є “найрозумнішою AI-системою на ринку”.

Однак співробітник OpenAI, який побажав залишитися анонімним, звинуватив xAI у маніпуляціях із результатами бенчмарків. Він стверджує, що дані, оприлюднені xAI, не відповідають незалежним тестам та можуть вводити користувачів в оману. Це викликало хвилю обговорень у сфері штучного інтелекту щодо прозорості методів оцінки AI-моделей.

Експерти закликають до незалежних перевірок результатів та стандартизованих методів оцінки, щоб уникнути подібних ситуацій у майбутньому. Станом на зараз xAI не надала офіційних коментарів щодо цих звинувачень.


Телеграм double.newsТелеграм double.news

Схожі Новини
Ілон Маск X

ЄС оштрафував X Ілон Маска на €120 мільйонів

Європейський Союз оштрафував компанію X на €120 мільйонів за порушення правил Закону про цифрові послуги, зокрема через оманливий дизайн синіх галочок, які позначають верифікованих користувачів. Це перший випадок накладення штрафу за новим законом.
Детальніше
3I/ATLAS

Hubble знову зафіксував міжзоряну комету 3I/ATLAS

30 листопада телескоп Hubble повторно зафіксував міжзоряну комету 3I/ATLAS, використовуючи свою камеру Wide Field Camera 3. На момент спостереження комета перебувала на відстані приблизно 286 мільйонів кілометрів від Землі.
Детальніше
Netflix придбала Warner Bros.

Netflix офіційно придбала Warner Bros. за $82,7 млрд

Netflix офіційно оголосила про придбання Warner Bros. Discovery за $82,7 млрд, завершивши угоду, що об'єднує легендарні студії Warner Bros., HBO та стрімінгову платформу HBO Max з найбільшою платформою розваг у світі.
Детальніше