xAI оприлюднила системні інструкції Grok після скандалу з некоректними відповідями

xAI

Чат-бот Grok від xAI почав вставляти згадки про “білий геноцид” у Південній Африці у відповіді на несумісні запити користувачів на платформі X. Наприклад, він пов’язував пісню “Kill the Boer” з мультфільмом “Губка Боб Квадратні Штани”.

Як повідомляє The Verge, xAI заявила, що це сталося через “несанкціоновану модифікацію” системного запиту Grok, яка суперечила внутрішнім політикам компанії. У відповідь компанія оприлюднила системні інструкції Grok на GitHub, щоб забезпечити прозорість і запобігти подібним інцидентам у майбутньому.

Системні інструкції Grok визначають його поведінку та відповіді на запити користувачів. Основні принципи включають:

  • Скептичність: Grok не повинен сліпо довіряти авторитетам чи ЗМІ.
  • Прагнення до правди: Чат-бот має надавати правдиву інформацію, навіть якщо вона суперечить загальноприйнятим наративам.
  • Нейтральність: Grok не повинен висловлювати власні переконання, а лише надавати інформацію.
  • Терміни платформи: Використання термінів “X” замість “Twitter” та “X пост” замість “твіту”.

Для порівняння, системні інструкції Claude AI від Anthropic зосереджені на безпеці користувачів, уникаючи створення шкідливого або неприйнятного контенту.

Після інциденту xAI вжила низку заходів для підвищення безпеки та прозорості. По-перше, компанія опублікувала системні інструкції Grok на GitHub. Це рішення має на меті забезпечити відкритість і дати змогу спільноті самостійно перевіряти логіку відповіді бота. Також створено спеціальну команду моніторингу, яка працює 24/7 для виявлення аномальної поведінки або зовнішнього втручання у систему.

Крім того, xAI впровадила додаткові рівні перевірки та затвердження змін до системних запитів. Це має запобігти несанкціонованим модифікаціям у майбутньому.

Ці кроки спрямовані на забезпечення стабільної та надійної роботи Grok, а також на відновлення довіри користувачів до платформи.


Телеграм double.newsТелеграм double.news

Схожі Новини
CD диск

CD-диску — 43 роки: як компакт-диск змінив медіаіндустрію

43 роки тому, 17 серпня 1982 року, компанія Polygram у Німеччині випустила перший комерційний компакт-диск (CD) — альбом The Visitors гурту ABBA. Ця подія стала відправною точкою цифрової революції у світі музики та мультимедійних технологій.
Детальніше
Apple CharismaticOS

Apple створює нову операційну систему Charismatic для розумного дому та робототехніки

Apple активно працює над новою операційною системою з кодовою назвою Charismatic, яка стане ключовою платформою для майбутніх пристроїв компанії у сфері розумного дому.
Детальніше
Білий карлик

Телескоп Hubble виявив залишок рідкісного злиття білих карликів

Міжнародна команда астрономів за допомогою космічного телескопа Hubble виявила надмасивного білого карлика, що виник не внаслідок звичної еволюції зірки, а в результаті злиття з іншою зорею. Це відкриття може свідчити про те, що такі злиття трапляються частіше, ніж вважалося раніше.
Детальніше