Дослідники виявили спосіб зламу Google Gemini за допомогою власних інструментів

Google Gemini

Дослідники з Каліфорнійського університету в Сан-Дієго та Університету Вісконсина виявили, що функція донавчання в Google Gemini може бути використана для підвищення ефективності атак типу “впровадження підказок” (prompt injection). Цей метод, названий “Fun-Tuning”, дозволяє зловмисникам автоматично тестувати та вдосконалювати шкідливі підказки, використовуючи зворотний зв’язок від моделі.

“Fun-Tuning” працює шляхом додавання незрозумілих префіксів та суфіксів до підказок, що значно підвищує ймовірність успішної атаки. Наприклад, підказка, яка спочатку не спрацьовувала, ставала ефективною після додавання таких елементів, як “wandel ! ! ! !” та “formatted ! ASAP !”. У тестах цей метод досяг успіху в 65% випадків на моделі Gemini 1.5 Flash та в 82% на старішій версії Gemini 1.0 Pro, що більш ніж удвічі перевищує базові показники без використання “Fun-Tuning”.

Google заявила, що захист від такого типу атак є пріоритетом для компанії, і вони регулярно проводять внутрішні тести для виявлення та усунення вразливостей. Однак дослідники вважають, що виправлення цієї проблеми може ускладнити корисні функції донавчання для розробників.

Джерело: Android Authority


Телеграм double.newsТелеграм double.news

Схожі Новини
Samsung Galaxy S26 Ultra

Samsung Galaxy S26 Ultra випередив iPhone 17 Pro Max у тестах Geekbench 6

Новий флагманський смартфон Samsung Galaxy S26 Ultra продемонстрував вищі результати в Geekbench 6, ніж iPhone 17 Pro Max. Згідно з оприлюдненими даними бенчмарку, модель на базі Snapdragon 8 Elite Gen 5 перевершила конкурента як у одноядерному, так і в багатоядерному тестуванні.
Детальніше
DDR 5 пам'ять

Ціни на DDR5 у Європі почали знижуватися попри дефіцит пам’яті

Роздрібні ціни на модулі DDR5 у Європі демонструють перші ознаки зниження після різкого зростання наприкінці 2025 року. Попри глобальний дефіцит DRAM та рекордні ціни у США, в окремих країнах ЄС вартість комплектів 32 ГБ DDR5-6000/6400 поступово коригується вниз.
Детальніше
WhatsApp

WhatsApp дозволив новим учасникам переглядати історію групових повідомлень

WhatsApp запускає функцію історію повідомлень у групах, яка дає новим учасникам груп доступ до попередніх повідомлень. Тепер адміністратори та учасники можуть поділитися частиною недавньої переписки, щоб новачки швидше зрозуміли контекст розмови.
Детальніше