Дослідження Apple: мовні моделі можуть можуть визначати ваші дії за аудіо та даними руху

Apple Intelligence

Apple опублікувала нове наукове дослідження, у якому вивчає можливості великих мовних моделей (LLM) визначати активність користувача на основі аудіосигналів і даних руху. Це відкриває перспективи точнішого аналізу поведінки навіть тоді, коли сенсорної інформації недостатньо. Водночас компанія підкреслює: йдеться не про роботу зі сирими аудіозаписами, а про обробку текстових описів, згенерованих окремими моделями. Про це пише 9to5Mac.

Дослідження Apple: як LLM допомагають розпізнавати дії

У статті під назвою «Using LLMs for Late Multimodal Sensor Fusion for Activity Recognition» дослідники Apple представили підхід, за яким LLM поєднують текстові описи аудіо та дані, отримані від моделей, що аналізують рух (IMU — акселерометр і гіроскоп). Таким чином система отримує стислий текстовий опис сенсорної інформації та на цій основі визначає, чим займається користувач.

Apple зазначає, що запропонований підхід може суттєво підвищити точність розпізнавання активностей у ситуаціях, коли сенсорних даних недостатньо, моделі не проходили спеціального навчання для конкретних завдань або коли важливо зменшити обсяг пам’яті та обчислювальних ресурсів, необхідних для роботи системи.

«Вони добре справляються, але не в тривожний спосіб»

У дослідженні підкреслено, що LLM демонструють точність вище випадкового рівня навіть у zero-shot режимі, тобто без додаткового навчання на вибірці активностей. Якщо моделі надати один приклад, точність зростає ще більше.

У дослідженні наголошується, що LLM не отримували самих аудіозаписів, а працювали лише з короткими текстовими описами, згенерованими аудіомоделями, прогнозами IMU-моделей та додатковим контекстом, що мінімізує ризики для конфіденційності та дає змогу аналізувати активність користувача без обробки приватного звуку.


Телеграм double.newsТелеграм double.news

Схожі Новини
Південна Корея роздаватиме безкоштовні ПК через кризу пам’яті

Південна Корея роздаватиме безкоштовні ПК через кризу пам’яті

Зростання цін на оперативну пам’ять і накопичувачі створює дедалі більший тиск на споживачів і бізнес у всьому світі. У відповідь на це Південна Корея готує комплекс заходів, спрямованих на зниження витрат і збереження доступу до цифрових технологій для населення.
Детальніше
CPUID

Хакери зламами сайт CPUID і поширювали шкідливі версії популярних застосунків

Французька компанія CPUID підтвердила злам свого офіційного сайту, через яку користувачі популярних утиліт CPU-Z і HWMonitor могли завантажити шкідливе програмне забезпечення. Інцидент тривав кілька годин і вже усунений, однак наслідки можуть торкнутися значної кількості користувачів.
Детальніше
MacOS X Wii

Mac OS X запустили на Nintendo Wii

Розробник Браян Келлер успішно запустив операційну систему Mac OS X 10.0 Cheetah на ігровій консолі Nintendo Wii. Експеримент став прикладом нестандартного використання старого програмного забезпечення та апаратного забезпечення, демонструючи гнучкість архітектури PowerPC.
Детальніше