Дослідники виявили спосіб зламу Google Gemini за допомогою власних інструментів

Google Gemini

Дослідники з Каліфорнійського університету в Сан-Дієго та Університету Вісконсина виявили, що функція донавчання в Google Gemini може бути використана для підвищення ефективності атак типу “впровадження підказок” (prompt injection). Цей метод, названий “Fun-Tuning”, дозволяє зловмисникам автоматично тестувати та вдосконалювати шкідливі підказки, використовуючи зворотний зв’язок від моделі.

“Fun-Tuning” працює шляхом додавання незрозумілих префіксів та суфіксів до підказок, що значно підвищує ймовірність успішної атаки. Наприклад, підказка, яка спочатку не спрацьовувала, ставала ефективною після додавання таких елементів, як “wandel ! ! ! !” та “formatted ! ASAP !”. У тестах цей метод досяг успіху в 65% випадків на моделі Gemini 1.5 Flash та в 82% на старішій версії Gemini 1.0 Pro, що більш ніж удвічі перевищує базові показники без використання “Fun-Tuning”.

Google заявила, що захист від такого типу атак є пріоритетом для компанії, і вони регулярно проводять внутрішні тести для виявлення та усунення вразливостей. Однак дослідники вважають, що виправлення цієї проблеми може ускладнити корисні функції донавчання для розробників.

Джерело: Android Authority


Телеграм double.newsТелеграм double.news

Схожі Новини
СЕО Anthropic

CEO Anthropic звинуватив OpenAI у брехні через контракт із Пентагоном

Генеральний директор Anthropic Даріо Амодей різко розкритикував OpenAI через співпрацю з Міністерством оборони США. У внутрішньому листі до співробітників він назвав заяви компанії про безпечне використання штучного інтелекту відвертою брехнею.
Детальніше
Play Store

Google знизить комісію Play Store і спростить встановлення сторонніх магазинів

Google оголосила про масштабні зміни у роботі Google Play після багаторічного судового конфлікту з Epic Games. Нові правила передбачають зниження комісій для розробників, підтримку альтернативних платіжних систем і спрощене встановлення сторонніх магазинів застосунків на Android.
Детальніше
Call of Duty: Modern Warfare III

У відео Білого дому про удари по Ірану використали фрагмент Call of Duty

Білий дім опублікував у соцмережах відео реальних військових ударів по Ірану, змонтоване у стилі роликів із серії Call of Duty. У відео поєднуються кадри реальних ракетних атак із монтажем, музикою та візуальними ефектами, характерними для ігрових хайлайтів.
Детальніше