xAI звинувачують у маніпуляціях з бенчмарками Grok-3

xAI

У лютому 2025 року компанія xAI представила Grok-3 — штучний інтелект нового покоління, який, за словами компанії, перевершує конкурентів, зокрема OpenAI та DeepSeek, у тестах з математики, науки та програмування. Представники xAI заявили, що їхня модель є “найрозумнішою AI-системою на ринку”.

Однак співробітник OpenAI, який побажав залишитися анонімним, звинуватив xAI у маніпуляціях із результатами бенчмарків. Він стверджує, що дані, оприлюднені xAI, не відповідають незалежним тестам та можуть вводити користувачів в оману. Це викликало хвилю обговорень у сфері штучного інтелекту щодо прозорості методів оцінки AI-моделей.

Експерти закликають до незалежних перевірок результатів та стандартизованих методів оцінки, щоб уникнути подібних ситуацій у майбутньому. Станом на зараз xAI не надала офіційних коментарів щодо цих звинувачень.


Телеграм double.newsТелеграм double.news

Схожі Новини
Drive and Listen

Drive and Listen: катайтесь вулицями Лондона, Берліна, Токіо та слухайте місцеве радіо

Уявіть, що ви їдете вузькими вуличками Парижа, швидкісними магістралями Лос-Анджелеса чи серед жвавого натовпу Токіо, а з динаміків лунає місцеве радіо. Вам не потрібно бронювати квитки чи збирати валізи – усе це можливо завдяки сервісу Drive and Listen.
Детальніше
QR код

Як сканувати QR-код за допомогою смартфона: швидка інструкція

QR-коди давно стали частиною повсякденного життя — від меню в кафе до швидкої авторизації в застосунках. Але не всі знають, як правильно їх сканувати зі свого смартфона. У цій статті пояснюємо, як це зробити на iPhone та Android, без додаткових програм.
Детальніше