xAI оприлюднила системні інструкції Grok після скандалу з некоректними відповідями

xAI

Чат-бот Grok від xAI почав вставляти згадки про “білий геноцид” у Південній Африці у відповіді на несумісні запити користувачів на платформі X. Наприклад, він пов’язував пісню “Kill the Boer” з мультфільмом “Губка Боб Квадратні Штани”.

Як повідомляє The Verge, xAI заявила, що це сталося через “несанкціоновану модифікацію” системного запиту Grok, яка суперечила внутрішнім політикам компанії. У відповідь компанія оприлюднила системні інструкції Grok на GitHub, щоб забезпечити прозорість і запобігти подібним інцидентам у майбутньому.

Системні інструкції Grok визначають його поведінку та відповіді на запити користувачів. Основні принципи включають:

  • Скептичність: Grok не повинен сліпо довіряти авторитетам чи ЗМІ.
  • Прагнення до правди: Чат-бот має надавати правдиву інформацію, навіть якщо вона суперечить загальноприйнятим наративам.
  • Нейтральність: Grok не повинен висловлювати власні переконання, а лише надавати інформацію.
  • Терміни платформи: Використання термінів “X” замість “Twitter” та “X пост” замість “твіту”.

Для порівняння, системні інструкції Claude AI від Anthropic зосереджені на безпеці користувачів, уникаючи створення шкідливого або неприйнятного контенту.

Після інциденту xAI вжила низку заходів для підвищення безпеки та прозорості. По-перше, компанія опублікувала системні інструкції Grok на GitHub. Це рішення має на меті забезпечити відкритість і дати змогу спільноті самостійно перевіряти логіку відповіді бота. Також створено спеціальну команду моніторингу, яка працює 24/7 для виявлення аномальної поведінки або зовнішнього втручання у систему.

Крім того, xAI впровадила додаткові рівні перевірки та затвердження змін до системних запитів. Це має запобігти несанкціонованим модифікаціям у майбутньому.

Ці кроки спрямовані на забезпечення стабільної та надійної роботи Grok, а також на відновлення довіри користувачів до платформи.


Телеграм double.newsТелеграм double.news

Схожі Новини
TikTok

TikTok дає змогу зменшити або збільшити кількість контенту, створеного AI

TikTok представив новий набір інструментів і ініціатив, спрямованих на підвищення прозорості та безпечного використання контенту, створеного штучним інтелектом. Компанія розширює можливості контролю для користувачів, впроваджує нові технології маркування AI-матеріалів і оголошує освітній фонд для розвитку культури відповідального використання ШІ.
Детальніше
Google CEO

CEO Google попереджає: якщо AI-бульбашка лусне, наслідків не уникне ніхто

Генеральний директор Alphabet Сундар Пічаї заявив, що штучний інтелект перебуває у фазі «ірраціонального» інвестування, і якщо ринок зіткнеться з різким спадом, жодна компанія не залишиться осторонь. Його коментарі пролунали на тлі історично високої капіталізації Alphabet та зростання занепокоєння щодо можливого надмірного інвестування в AI-індустрії.
Детальніше
Google Chrome

Користувачам Chrome радять оновити браузер через критичну вразливість

Google випустила оновлення для усунення небезпечної вразливості в настільній версії Chrome. Помилка, яку вже активно експлуатують зловмисники, дає можливість віддалено виконувати шкідливий код через спеціально створені вебсторінки. Компанія закликає користувачів негайно оновити браузер на всіх підтримуваних платформах.
Детальніше