xAI звинувачують у маніпуляціях з бенчмарками Grok-3

xAI

У лютому 2025 року компанія xAI представила Grok-3 — штучний інтелект нового покоління, який, за словами компанії, перевершує конкурентів, зокрема OpenAI та DeepSeek, у тестах з математики, науки та програмування. Представники xAI заявили, що їхня модель є “найрозумнішою AI-системою на ринку”.

Однак співробітник OpenAI, який побажав залишитися анонімним, звинуватив xAI у маніпуляціях із результатами бенчмарків. Він стверджує, що дані, оприлюднені xAI, не відповідають незалежним тестам та можуть вводити користувачів в оману. Це викликало хвилю обговорень у сфері штучного інтелекту щодо прозорості методів оцінки AI-моделей.

Експерти закликають до незалежних перевірок результатів та стандартизованих методів оцінки, щоб уникнути подібних ситуацій у майбутньому. Станом на зараз xAI не надала офіційних коментарів щодо цих звинувачень.

Схожі Новини
microsoft edge

Microsoft Edge для Android отримує підтримку розширень: Chrome відстає

Microsoft Edge на Android тепер підтримує розширення, надаючи користувачам можливість розширювати функціональність браузера без необхідності встановлення окремих додатків. Ця функція виділяє Edge серед мобільних браузерів, оскільки Google Chrome досі не впровадив підтримку розширень на Android.
Детальніше
OpenAI Action Plan

OpenAI закликає надати необмежений доступ до матеріалів, захищених авторським правом, для навчання AI

У відповідь на запит Білого дому щодо розробки "AI Action Plan", OpenAI подала пропозицію, в якій наголошує на необхідності дозволити використання захищених авторським правом матеріалів для навчання AI-моделей. Компанія стверджує, що це є критично важливим для збереження лідерства США в галузі штучного інтелекту, особливо враховуючи, що китайські розробники AI мають необмежений доступ до таких даних. ​
Детальніше
Android 16

Google тестує новий дизайн налаштувань Android: “експресивний” інтерфейс у майбутніх версіях

У бета-версії Android 16 було виявлено новий дизайн додатку "Налаштування", який Google називає "експресивним". Цей редизайн спрямований на покращення візуального сприйняття та зручності навігації користувачами, повідомляє Android Authority.
Детальніше