
Google повідомила про спроби відтворити модель (model extraction) щодо свого чат-бота Gemini. За даними компанії, приватні структури надсилали понад 100 тисяч спеціально сформованих запитів, щоб змусити систему розкрити внутрішню логіку роботи. Про це пише PCMag.
Про це йдеться у звіті Google за четвертий квартал, присвяченому шкідливій активності проти сервісу. Компанія не називає конкретних учасників, але стверджує, що атаки надходили з різних країн світу.
Спробив відтворити Gemini
На відміну від традиційного злому, спроби відтворити модель не передбачає проникнення в корпоративну мережу чи використання програмних уразливостей. Зловмисники використовують легальний доступ до API, який Google надає розробникам для інтеграції Gemini у власні застосунки.
Мета таких дій змусити модель показати повний процес міркування, а не лише кінцеву відповідь. У стандартному режимі Gemini генерує результат без демонстрації внутрішніх кроків аналізу. Проте спеціально сформовані запити можуть намагатися обійти ці обмеження.
За інформацією Google, деякі запити вимагали від моделі використовувати ту саму мову в «мисленні», що й у запиті користувача, щоб витягти приховані елементи логіки.
Потенційна загроза для інтелектуальної власності

Google називає такі дії формою крадіжки інтелектуальної власності. Якщо конкурент зможе відтворити внутрішні механізми роботи Gemini, це дозволить створити схожу модель без витрат на повноцінні дослідження та розробку.
Компанія зазначає, що подібні атаки можуть використовуватися не лише для комерційного копіювання, а й для створення AI-моделей без обмежень безпеки. Наприклад, конкурент може спробувати відтворити модель для фінансового аналізу або програмування без вбудованих захисних механізмів.

