Дослідники виявили спосіб зламу Google Gemini за допомогою власних інструментів

Google Gemini

Дослідники з Каліфорнійського університету в Сан-Дієго та Університету Вісконсина виявили, що функція донавчання в Google Gemini може бути використана для підвищення ефективності атак типу “впровадження підказок” (prompt injection). Цей метод, названий “Fun-Tuning”, дозволяє зловмисникам автоматично тестувати та вдосконалювати шкідливі підказки, використовуючи зворотний зв’язок від моделі.

“Fun-Tuning” працює шляхом додавання незрозумілих префіксів та суфіксів до підказок, що значно підвищує ймовірність успішної атаки. Наприклад, підказка, яка спочатку не спрацьовувала, ставала ефективною після додавання таких елементів, як “wandel ! ! ! !” та “formatted ! ASAP !”. У тестах цей метод досяг успіху в 65% випадків на моделі Gemini 1.5 Flash та в 82% на старішій версії Gemini 1.0 Pro, що більш ніж удвічі перевищує базові показники без використання “Fun-Tuning”.

Google заявила, що захист від такого типу атак є пріоритетом для компанії, і вони регулярно проводять внутрішні тести для виявлення та усунення вразливостей. Однак дослідники вважають, що виправлення цієї проблеми може ускладнити корисні функції донавчання для розробників.

Джерело: Android Authority


Телеграм double.newsТелеграм double.news

Схожі Новини
MacBook Pro

Нові MacBook Pro з чипами M5 можуть вийти разом із macOS 26.3

Apple готується до оновлення лінійки професійних ноутбуків. За даними інсайдерів, нові MacBook Pro з чипами M5 Pro та M5 Max можуть бути представлені одночасно з релізом macOS 26.3, який очікується вже у лютому 2026 року.
Детальніше
YouTube

YouTube обмежив фонове відтворення у сторонніх браузерах без Premium

Користувачі YouTube масово повідомляють про проблеми з фоновим відтворенням відео в мобільних браузерах, відмінних від Chrome. Як з’ясувалося, це не збій, а цілеспрямована зміна політики сервісу: Google офіційно підтвердила, що функція фонового програвання відтепер доступна лише для передплатників YouTube Premium.
Детальніше
NASA з’ясувала, що відбувається за мілісекунди до зіткнення нейтронних зір

NASA з’ясувала, що відбувається за мілісекунди до зіткнення нейтронних зір

Вчені NASA отримали найдетальнішу на сьогодні картину процесів, які відбуваються за лічені мілісекунди до злиття нейтронних зір - одних із найекстремальніших об’єктів у Всесвіті. Нові суперкомп’ютерні симуляції показують, що безпосередньо перед зіткненням навколо зір виникає хаотична взаємодія надпотужних магнітних полів, здатна породжувати випромінювання, яке майбутні телескопи зможуть зафіксувати.
Детальніше