
xAI офіційно випустила нову модель Grok 4.1, яка вже доступна користувачам на офіційному сайті, у застосунках для iOS та Android, а також у сервісі X. Оновлення почало розгортатися в автоматичному режимі й може бути обраним вручну в меню моделей. За даними компанії, Grok 4.1 значно підвищує реальну корисність асистента, демонструючи покращену емоційну чутливість, креативність і стабільність.
Що нового у Grok 4.1
Оновлена версія Grok 4.1 створена на основі масштабної reinforcement learning-інфраструктури, яку xAI використовувала й під час розробки Grok 4, завдяки чому модель зберегла інтелектуальну точність попередників і водночас отримала покращену емоційну взаємодію, більш узгоджену «особистість», глибше розуміння намірів користувача та помітно нижчий рівень фактологічних помилок.
Для оптимізації стилю, співчуття, корисності та узгодженості відповідачів xAI використала нові методи, що дозволили застосувати передові агентні моделі, які автоматично оцінюють і покращують відповіді у великому масштабі.
Тестування перед релізом
Перед повноцінним публічним запуском xAI зробили поступове розгортання попередніх збірок Grok 4.1 протягом двох тижнів. Модель тестували на реальному трафіку grok.com, X та мобільних застосунків, проводя чи безперервні сліпі порівняльні оцінки відповідей.

Grok 4.1 виявився переважно кращим за попередню версію у 64,78% випадків, що стало основою для рішення про публічний реліз.
Лідерство в рейтингах і продуктивність

У текстовій арені LMArena модель Grok 4.1 Thinking посіла 1-ше місце з показником 1483 Elo, випередивши інші моделі на ринку. Версія без reasoning-токенів тотримала 1465 Elo і стала другою, перевершивши reasoning-конфігурації конкурентів. Для порівняння: Grok 4 раніше посідав 33 місце.

