xAI звинувачують у маніпуляціях з бенчмарками Grok-3

xAI

У лютому 2025 року компанія xAI представила Grok-3 — штучний інтелект нового покоління, який, за словами компанії, перевершує конкурентів, зокрема OpenAI та DeepSeek, у тестах з математики, науки та програмування. Представники xAI заявили, що їхня модель є “найрозумнішою AI-системою на ринку”.

Однак співробітник OpenAI, який побажав залишитися анонімним, звинуватив xAI у маніпуляціях із результатами бенчмарків. Він стверджує, що дані, оприлюднені xAI, не відповідають незалежним тестам та можуть вводити користувачів в оману. Це викликало хвилю обговорень у сфері штучного інтелекту щодо прозорості методів оцінки AI-моделей.

Експерти закликають до незалежних перевірок результатів та стандартизованих методів оцінки, щоб уникнути подібних ситуацій у майбутньому. Станом на зараз xAI не надала офіційних коментарів щодо цих звинувачень.


Телеграм double.newsТелеграм double.news

Схожі Новини
Ілон Маск

AI-бум додав понад $500 млрд до статків техномільярдерів США у 2025 році

Стрімке зростання інтересу інвесторів до компаній у сфері штучного інтелекту суттєво змінило баланс багатства серед найбагатших людей світу. Лише за 2025 рік AI-бум додав понад пів трильйона доларів до сукупних статків провідних американських технологічних магнатів.
Детальніше
Китай готує жорсткі правила для людиноподібних AI-систем

Китай готує жорсткі правила для людиноподібних AI-систем

Китайська влада оприлюднила проєкт нових регуляторних вимог, спрямованих на контроль використання штучного інтелекту, який імітує поведінку людини. Ініціатива є частиною ширшої стратегії Пекіна щодо розвитку AI як ключової галузі економіки, водночас посилюючи державний нагляд за безпекою та етичними аспектами технологій.
Детальніше
ChatGPT

ChatGPT може почати просувати спонсорований контент у відповідях

OpenAI розглядає можливість інтеграції реклами безпосередньо у відповіді ChatGPT. За даними джерел, ідеться не про класичні банери, а про пріоритетне відображення спонсорованого контенту в результатах роботи мовної моделі.
Детальніше