Дослідження Apple: мовні моделі можуть можуть визначати ваші дії за аудіо та даними руху

Apple Intelligence

Apple опублікувала нове наукове дослідження, у якому вивчає можливості великих мовних моделей (LLM) визначати активність користувача на основі аудіосигналів і даних руху. Це відкриває перспективи точнішого аналізу поведінки навіть тоді, коли сенсорної інформації недостатньо. Водночас компанія підкреслює: йдеться не про роботу зі сирими аудіозаписами, а про обробку текстових описів, згенерованих окремими моделями. Про це пише 9to5Mac.

Дослідження Apple: як LLM допомагають розпізнавати дії

У статті під назвою «Using LLMs for Late Multimodal Sensor Fusion for Activity Recognition» дослідники Apple представили підхід, за яким LLM поєднують текстові описи аудіо та дані, отримані від моделей, що аналізують рух (IMU — акселерометр і гіроскоп). Таким чином система отримує стислий текстовий опис сенсорної інформації та на цій основі визначає, чим займається користувач.

Apple зазначає, що запропонований підхід може суттєво підвищити точність розпізнавання активностей у ситуаціях, коли сенсорних даних недостатньо, моделі не проходили спеціального навчання для конкретних завдань або коли важливо зменшити обсяг пам’яті та обчислювальних ресурсів, необхідних для роботи системи.

«Вони добре справляються, але не в тривожний спосіб»

У дослідженні підкреслено, що LLM демонструють точність вище випадкового рівня навіть у zero-shot режимі, тобто без додаткового навчання на вибірці активностей. Якщо моделі надати один приклад, точність зростає ще більше.

У дослідженні наголошується, що LLM не отримували самих аудіозаписів, а працювали лише з короткими текстовими описами, згенерованими аудіомоделями, прогнозами IMU-моделей та додатковим контекстом, що мінімізує ризики для конфіденційності та дає змогу аналізувати активність користувача без обробки приватного звуку.


Телеграм double.newsТелеграм double.news

Схожі Новини
Джоні Сруджі Apple

Керівник підрозділу чипів Apple може залишити компанію

Як повідомляє Bloomberg, старший віцепрезидент з апаратних технологій Джоні Сруджі, який очолює підрозділ розробки чипів і відіграє ключову роль у створенні процесорів Apple Silicon, серйозно розглядає можливість переходу до іншої компанії. Це може стати черговою ланкою у серії недавніх відходів топменеджерів, які посилюють відчуття нестабільності всередині корпорації.
Детальніше
Розумний холодильник Samsung

Жінка з шизофренією потрапила в лікарню через рекламу на холодильнику Samsung

У Великій Британії родина повідомила про інцидент, коли реклама на екрані смарт-холодильника Samsung спричинила загострення психічного стану їхньої близької - жінки на ім’я Керол, яка живе з діагнозом шизофренії. Повідомлення на дисплеї, що мало вигляд персонального вибачення, вона сприйняла як звернене безпосередньо до неї.
Детальніше
Logitech

CEO Logitech заявила, що AI-пристрої — це рішення, яке шукає проблему

Генеральна директорка Logitech Ганнеке Фабер заявила, що компанія тимчасово припиняє підвищення цін та не планує розробляти окремі ґаджети, орієнтовані на штучний інтелект. В інтерв’ю Bloomberg вона різко оцінила тренд на AI-пристрої, назвавши більшість із них рішенням, яке шукає проблему.
Детальніше