Вийшов DragGAN – ШІ, що вміє крутити все підряд

Вчені з Google і декількох університетів опублікували відкритий код нейромережі DragGAN, що може маніпулювати об’єктами або їх фрагментами на фотографіях.

DragGAN виявився здатний працювати з об’єктами різних типів. У демонстраційному відео, розробники нейромережі змінили вирази облич людей, змушуючи собак сісти або дивитись у камеру, а також коригували зовнішній вигляд автомобілів.

Цікаво, що нейромережа взаємодіє не лише з об’єктом, але й з його оточенням. Іноді це призводить до невдалого результату: штучний інтелект не завжди якісно домальовує або трансформує фони. Схоже, що найменше проблем виникає з об’єктами на білому фоні.

Згідно з розробниками, DragGAN має працювати як на відеокартах з CUDA-ядрами, так і на чіпах без підтримки цієї технології. Процесори M1 і M2, створені Apple, також підтримуються.

Розробники проекту не уточнили, яке потужне обладнання буде необхідне для використання DragGAN. Нейромережу можна використовувати як під Linux і Mac OS, так і під Windows.

DragGAN – це вражаючий приклад того, як глибоке навчання і нейронні мережі можуть трансформувати наш підхід до обробки зображень. Ця технологія може відкрити нові горизонти в областях, як-то графічний дизайн, редагування фотографій, кіно і багато іншого.


Телеграм double.newsТелеграм double.news

Схожі Новини
Valve Steam Machine

Valve обіцяє тисячі підтримуваних ігор для Steam Machine на старті

Нова Steam Machine від Valve може стартувати з набагато потужнішою бібліотекою перевірених ігор, ніж свого часу Steam Deck. У компанії заявляють, що розробникам буде значно простіше отримати статус верифікованої гри для Steam Machine, що дозволить користувачам одразу після покупки отримати доступ до тисяч ігор без додаткових налаштувань.
Детальніше
Gemini

Apple заплатить Google до $5 млрд за інтеграцію Gemini у Siri

Партнерство між Apple та Google у сфері штучного інтелекту може стати однією з наймасштабніших угод на ринку AI-сервісів за останні роки. Йдеться про інтеграцію мовних моделей Gemini у Siri та екосистему Apple Intelligence, вартість якої, за оцінками аналітиків, може сягнути $5 млрд.
Детальніше
MrBeast

Найпопулярніший YouTube-блогер MrBeast змушений позичати гроші

Найпопулярніший YouTube-блогер світу MrBeast, справжнє ім’я якого Джиммі Дональдсон, заявив, що попри мільярдні статки фактично не має вільних коштів. За його словами, він змушений позичати гроші, оскільки майже весь дохід постійно реінвестує у власні проєкти.
Детальніше