DeepMind представив Genie 3 — модель світу для наближення до штучного загального інтелекту

DeepMind Genie 3

Компанія Google DeepMind презентувала Genie 3 — свою найновішу світову модель, яка може стати ключовим кроком на шляху до створення AGI (Artificial General Intelligence) — універсального штучного інтелекту, здатного до людськоподібного навчання й мислення. Про це повідомляє TechCrunch.

Що таке Genie 3 і як вона працює

Genie 3 — це перша інтерактивна модель світу загального призначення в режимі реального часу, яка генерує фотореалістичні, уявні або комбіновані 3D-середовища за текстовим запитом. На відміну від попередніх моделей, вона не обмежується вузькими сценаріями: користувач може створювати цілі світи на кілька хвилин, у роздільній здатності 720p, зі швидкістю 24 кадри на секунду.

“Genie 3 йде далі за інші моделі — вона не прив’язана до конкретного середовища”, — зазначив Шломі Фрухтер, директор з досліджень DeepMind.

Пам’ять, фізика та послідовність

Однією з ключових інновацій є здатність моделі пам’ятати попередньо згенероване, що забезпечує фізичну послідовність подій у часі. Такий ефект не було прямо запрограмовано, а він став емергентною властивістю моделі. Genie 3 створює кожен кадр поетапно, озираючись на те, що було раніше — як людина, що аналізує події у динаміці.

Це дозволяє моделі інтуїтивно розуміти фізику — наприклад, що предмет, який завис на краю, ось-ось впаде.

Новий рівень навчання агентів

Genie 3 створює потенційно ідеальне середовище для тренування агентів загального призначення. Вона не використовує жорстко задані фізичні движки, а самостійно навчається, як об’єкти падають, рухаються і взаємодіють.

Такі симуляції можуть змусити агентів адаптуватися, експериментувати та вчитися на помилках, подібно до того, як це відбувається у реальному житті.

Обмеження та перспективи

На сьогодні Genie 3 все ще має обмеження:

  • Час безперервної взаємодії обмежений кількома хвилинами.
  • Важко моделювати складні взаємодії між кількома агентами.
  • Більшість змін у середовищі запускаються за запитом, а не самими агентами.


Телеграм double.newsТелеграм double.news

Схожі Новини
Instant Checkout

OpenAI запускає функцію покупок прямо у ChatGPT

Користувачі ChatGPT вже можуть здійснювати покупки з Etsy та незабаром — з понад мільйона продавців Shopify. Це стало можливим завдяки новій функції Instant Checkout, яка інтегрує пошук, рекомендації та оплату безпосередньо у чаті.
Детальніше
YouTube

YouTube погодився виплатити Трампу $24,5 млн для врегулювання позову

Компанія Alphabet, власник YouTube, погодилася виплатити $24,5 млн, щоб врегулювати судову справу, подану Дональдом Трампом у 2021 році. Позов стосувався блокування його акаунта після штурму Капітолію прихильниками Трампа 6 січня 2021 року.
Детальніше
Anthropic Claude Sonnet 4.5

Anthropic випустила Claude Sonnet 4.5 з розширеними можливостями програмування

Anthropic оголосила про запуск нової моделі штучного інтелекту Claude Sonnet 4.5, яку позиціонує як найпродуктивнішу у сфері розробки програмного забезпечення. Головна особливість моделі — здатність автономно працювати понад 30 годин, створюючи та налагоджуючи готові до використання застосунки.
Детальніше