Дослідники виявили спосіб зламу Google Gemini за допомогою власних інструментів

Google Gemini

Дослідники з Каліфорнійського університету в Сан-Дієго та Університету Вісконсина виявили, що функція донавчання в Google Gemini може бути використана для підвищення ефективності атак типу “впровадження підказок” (prompt injection). Цей метод, названий “Fun-Tuning”, дозволяє зловмисникам автоматично тестувати та вдосконалювати шкідливі підказки, використовуючи зворотний зв’язок від моделі.

“Fun-Tuning” працює шляхом додавання незрозумілих префіксів та суфіксів до підказок, що значно підвищує ймовірність успішної атаки. Наприклад, підказка, яка спочатку не спрацьовувала, ставала ефективною після додавання таких елементів, як “wandel ! ! ! !” та “formatted ! ASAP !”. У тестах цей метод досяг успіху в 65% випадків на моделі Gemini 1.5 Flash та в 82% на старішій версії Gemini 1.0 Pro, що більш ніж удвічі перевищує базові показники без використання “Fun-Tuning”.

Google заявила, що захист від такого типу атак є пріоритетом для компанії, і вони регулярно проводять внутрішні тести для виявлення та усунення вразливостей. Однак дослідники вважають, що виправлення цієї проблеми може ускладнити корисні функції донавчання для розробників.

Джерело: Android Authority


Телеграм double.newsТелеграм double.news

Схожі Новини
Steam

Steam дозволить додавати характеристики ПК до відгуків

Valve тестує нововведення у клієнті Steam, яке може зробити користувацькі відгуки значно інформативнішими. У бета-версії сервісу з’явилася можливість автоматично додавати характеристики комп’ютера до рецензії на гру.
Детальніше
Wifi роуетр

Через дефіцит пам’яті зростають ціни на роутери та ТВ-приставки

Світовий дефіцит пам’яті DRAM та зростання попиту з боку індустрії штучного інтелекту спричинили різке подорожчання модулів DDR4, що вже відображається на вартості роутерів і ТВ-приставок. За оцінками аналітиків Counterpoint Research, ціни на відповідну пам’ять зросли приблизно у сім разів, а її частка в собівартості обладнання збільшилася з близько 3% до майже 20%, що суттєво впливає на формування кінцевої ціни пристроїв для споживачів.
Детальніше

Sony запатентувала технологію, що дозволяє зменшити розмір ігор до 100 МБ

Sony запатентувала новий підхід до встановлення відеоігор, який потенційно може суттєво скоротити початковий розмір завантаження. Замість традиційних 100–300 ГБ користувачам пропонується інсталювати лише базовий пакет обсягом близько 100 МБ, тоді як решта ресурсів підвантажуватиметься під час гри через інтернет.
Детальніше