Google визнає проблеми з безпекою нової моделі ШІ Gemini 2.5 Flash

Google Gemini 2.5 Flash

У нещодавньому технічному звіті Google повідомила, що її нова модель штучного інтелекту Gemini 2.5 Flash, яка наразі перебуває на стадії попереднього перегляду, демонструє гірші результати в тестах безпеки порівняно з попередньою версією Gemini 2.0 Flash. Зокрема, у метриках “текст до тексту” та “зображення до тексту” спостерігається погіршення на 4,1% та 9,6% відповідно. Про це пише TechCrunch.

Ці тести оцінюють, наскільки часто модель порушує внутрішні правила безпеки Google, генеруючи небажаний або шкідливий контент у відповідь на текстові або візуальні запити. Важливо зазначити, що обидва тести є автоматизованими та не передбачають участі людини в оцінюванні.

За словами представника Google, Gemini 2.5 Flash “гірше виконує завдання з безпеки в порівнянні з попередньою версією”. Компанія пояснює це тим, що нова модель краще слідує інструкціям користувача, навіть якщо ці інструкції суперечать політикам безпеки. Це означає, що модель може генерувати небажаний контент, якщо її явно про це просять.

Крім того, Google зазначає, що частина погіршення результатів може бути пов’язана з хибнопозитивними спрацьовуваннями в автоматичних тестах. Проте компанія визнає, що в деяких випадках Gemini 2.5 Flash дійсно генерує контент, який порушує встановлені правила.

Ці результати викликають занепокоєння, особливо на тлі загальної тенденції в галузі ШІ до створення моделей, які менш схильні відмовлятися відповідати на суперечливі або чутливі запити. Наприклад, Meta та OpenAI також працюють над тим, щоб їхні моделі були більш “допустимими” в таких ситуаціях.

Однак, як показує випадок з Gemini 2.5 Flash, така стратегія може призвести до небажаних наслідків, коли моделі починають генерувати контент, що суперечить етичним або юридичним нормам.

Google поки що не повідомила про конкретні кроки щодо виправлення ситуації з Gemini 2.5 Flash. Очікується, що компанія надасть додаткову інформацію та оновлення щодо безпеки моделі в майбутньому.

Погіршення показників безпеки в новій моделі Gemini 2.5 Flash підкреслює складність балансу між здатністю ШІ слідувати інструкціям користувача та необхідністю дотримання етичних стандартів. Цей випадок служить нагадуванням про важливість ретельного тестування та постійного вдосконалення моделей ШІ перед їх широким впровадженням.


Телеграм double.newsТелеграм double.news

Схожі Новини
Drive and Listen

Drive and Listen: катайтесь вулицями Лондона, Берліна, Токіо та слухайте місцеве радіо

Уявіть, що ви їдете вузькими вуличками Парижа, швидкісними магістралями Лос-Анджелеса чи серед жвавого натовпу Токіо, а з динаміків лунає місцеве радіо. Вам не потрібно бронювати квитки чи збирати валізи – усе це можливо завдяки сервісу Drive and Listen.
Детальніше
QR код

Як сканувати QR-код за допомогою смартфона: швидка інструкція

QR-коди давно стали частиною повсякденного життя — від меню в кафе до швидкої авторизації в застосунках. Але не всі знають, як правильно їх сканувати зі свого смартфона. У цій статті пояснюємо, як це зробити на iPhone та Android, без додаткових програм.
Детальніше