Дослідники виявили спосіб зламу Google Gemini за допомогою власних інструментів

Google Gemini

Дослідники з Каліфорнійського університету в Сан-Дієго та Університету Вісконсина виявили, що функція донавчання в Google Gemini може бути використана для підвищення ефективності атак типу “впровадження підказок” (prompt injection). Цей метод, названий “Fun-Tuning”, дозволяє зловмисникам автоматично тестувати та вдосконалювати шкідливі підказки, використовуючи зворотний зв’язок від моделі.

“Fun-Tuning” працює шляхом додавання незрозумілих префіксів та суфіксів до підказок, що значно підвищує ймовірність успішної атаки. Наприклад, підказка, яка спочатку не спрацьовувала, ставала ефективною після додавання таких елементів, як “wandel ! ! ! !” та “formatted ! ASAP !”. У тестах цей метод досяг успіху в 65% випадків на моделі Gemini 1.5 Flash та в 82% на старішій версії Gemini 1.0 Pro, що більш ніж удвічі перевищує базові показники без використання “Fun-Tuning”.

Google заявила, що захист від такого типу атак є пріоритетом для компанії, і вони регулярно проводять внутрішні тести для виявлення та усунення вразливостей. Однак дослідники вважають, що виправлення цієї проблеми може ускладнити корисні функції донавчання для розробників.

Джерело: Android Authority


Телеграм double.newsТелеграм double.news

Схожі Новини
Телескоп Chime

Астрономи зафіксували найяскравіший у історії радіоспалах — з галактики на відстані 130 мільйонів світлових років

Міжнародна команда вчених, серед яких фізики з MIT, оголосила про відкриття найяскравішого швидкого радіоспалаху, який коли-небудь реєстрували астрономи. Сигнал, що тривав лише мілісекунду, було зафіксовано 16 березня 2025 року з галактики NGC 4141, розташованої у 130 мільйонах світлових років від Землі — порівняно близько за космічними мірками.
Детальніше
Ілон Маск Цукерберг

Ілон Маск пропонував Цукербергу спільно купити OpenAI за $97 мільярдів — OpenAI вимагає документи від Meta

OpenAI вимагає від Meta надати документи, які можуть підтвердити можливу участь компанії у $97-мільярдній пропозиції Ілона Маска щодо купівлі розробника ChatGPT. Таке прохання викладене в судовому клопотанні, поданому в рамках поточного позову Маска проти OpenAI
Детальніше