Дослідники виявили спосіб зламу Google Gemini за допомогою власних інструментів

Google Gemini

Дослідники з Каліфорнійського університету в Сан-Дієго та Університету Вісконсина виявили, що функція донавчання в Google Gemini може бути використана для підвищення ефективності атак типу “впровадження підказок” (prompt injection). Цей метод, названий “Fun-Tuning”, дозволяє зловмисникам автоматично тестувати та вдосконалювати шкідливі підказки, використовуючи зворотний зв’язок від моделі.

“Fun-Tuning” працює шляхом додавання незрозумілих префіксів та суфіксів до підказок, що значно підвищує ймовірність успішної атаки. Наприклад, підказка, яка спочатку не спрацьовувала, ставала ефективною після додавання таких елементів, як “wandel ! ! ! !” та “formatted ! ASAP !”. У тестах цей метод досяг успіху в 65% випадків на моделі Gemini 1.5 Flash та в 82% на старішій версії Gemini 1.0 Pro, що більш ніж удвічі перевищує базові показники без використання “Fun-Tuning”.

Google заявила, що захист від такого типу атак є пріоритетом для компанії, і вони регулярно проводять внутрішні тести для виявлення та усунення вразливостей. Однак дослідники вважають, що виправлення цієї проблеми може ускладнити корисні функції донавчання для розробників.

Джерело: Android Authority


Телеграм double.newsТелеграм double.news

Схожі Новини
GPT‑5.4 mini

OpenAI представила GPT-5.4 mini та nano для швидких AI-задач

OpenAI анонсувала нові компактні моделі штучного інтелекту — GPT-5.4 mini та GPT-5.4 nano. Вони орієнтовані на високу швидкість, ефективність і роботу з масштабними навантаженнями, де критично важлива низька затримка.
Детальніше
Apple

Apple втратила ще одного топменеджера: керівник домашніх пристроїв переходить до Oura

Один із ключових менеджерів Apple, який відповідав за розробку пристроїв для розумного дому, залишає компанію. Керівник апаратної інженерії підрозділу домашніх пристроїв Браян Лінч переходить до виробника смарт-кілець Oura Health Oy.
Детальніше

Mozilla представила нового персонажа Firefox — істоту на ім’я Kit

Mozilla представила нового персонажа браузера Mozilla Firefox — істоту на ім’я Kit. Він має стати символом підтримки користувачів під час роботи в інтернеті та з’являтиметься як у самому браузері, так і в маркетингових матеріалах.
Детальніше