
Google DeepMind представила нову версію моделі для редагування зображень, інтегровану у застосунок Gemini. Тепер користувачі отримали ще більше можливостей для створення реалістичних і персоналізованих фото за допомогою простих текстових підказок.
Збереження впізнаваності
Одним із головних викликів при редагуванні фото була схожість персонажів у різних кадрах. Користувачі часто стикалися з тим, що після кількох змін зображення людина чи тварина вже не виглядали як самі собі. Оновлена модель Gemini вирішує цю проблему: тепер редаговані фото залишаються більш послідовними та реалістичними, незалежно від кількості правок.
Нові функції редагування
У блозі компанія називає кілька можливостей, які вже доступні:
- Костюм чи зміна локації: розмістіть себе у новій професії, стилі чи країні, зберігаючи реалістичність вигляду.
- Поєднання фото: завантажте кілька зображень і створіть нову сцену — наприклад, портрет із домашнім улюбленцем на баскетбольному майданчику.
- Багатокрокове редагування (multi-turn editing): поступово змінюйте частини фото — додайте колір стін, меблі чи аксесуари в кімнаті.
- Змішування стилів: переносьте текстуру чи візерунок з одного зображення на інший об’єкт — наприклад, використати крильця метелика як дизайн для сукні.
Водяні знаки для прозорості
Усі створені чи відредаговані у Gemini зображення отримують видимий водяний знак, а також невидимий цифровий підпис SynthID. Це дозволяє чітко позначати контент як створений ШІ.