Дослідження Apple: мовні моделі можуть можуть визначати ваші дії за аудіо та даними руху

Apple Intelligence

Apple опублікувала нове наукове дослідження, у якому вивчає можливості великих мовних моделей (LLM) визначати активність користувача на основі аудіосигналів і даних руху. Це відкриває перспективи точнішого аналізу поведінки навіть тоді, коли сенсорної інформації недостатньо. Водночас компанія підкреслює: йдеться не про роботу зі сирими аудіозаписами, а про обробку текстових описів, згенерованих окремими моделями. Про це пише 9to5Mac.

Дослідження Apple: як LLM допомагають розпізнавати дії

У статті під назвою «Using LLMs for Late Multimodal Sensor Fusion for Activity Recognition» дослідники Apple представили підхід, за яким LLM поєднують текстові описи аудіо та дані, отримані від моделей, що аналізують рух (IMU — акселерометр і гіроскоп). Таким чином система отримує стислий текстовий опис сенсорної інформації та на цій основі визначає, чим займається користувач.

Apple зазначає, що запропонований підхід може суттєво підвищити точність розпізнавання активностей у ситуаціях, коли сенсорних даних недостатньо, моделі не проходили спеціального навчання для конкретних завдань або коли важливо зменшити обсяг пам’яті та обчислювальних ресурсів, необхідних для роботи системи.

«Вони добре справляються, але не в тривожний спосіб»

У дослідженні підкреслено, що LLM демонструють точність вище випадкового рівня навіть у zero-shot режимі, тобто без додаткового навчання на вибірці активностей. Якщо моделі надати один приклад, точність зростає ще більше.

У дослідженні наголошується, що LLM не отримували самих аудіозаписів, а працювали лише з короткими текстовими описами, згенерованими аудіомоделями, прогнозами IMU-моделей та додатковим контекстом, що мінімізує ризики для конфіденційності та дає змогу аналізувати активність користувача без обробки приватного звуку.


Телеграм double.newsТелеграм double.news

Схожі Новини
iPhone 17 Pro Max

Користувачі iPhone 17 Pro скаржаться на шипіння динаміка під час заряджання

Після виходу нових смартфонів Apple традиційно з’являються поодинокі скарги на програмні або апаратні нюанси. Цього разу частина власників iPhone 17 Pro та iPhone 17 Pro Max повідомляє про незвичну проблему - сторонній шум або шипіння з динаміків під час заряджання пристрою.
Детальніше
NVIDIA Intel

Nvidia завершила інвестицію в Intel на $5 млрд

Американський виробник чипів Nvidia придбав акції Intel на суму $5 млрд, реалізувавши інвестиційну угоду, про яку компанії домовилися ще у вересні. Про це повідомляє Reuters із посиланням на офіційні документи Intel, подані в понеділок.
Детальніше
Марк Цукерберг

Meta посилює ставку на AI, придбавши стартап Manus за $2 млрд

Meta оголосила про придбання Manus - AI-стартапу із Сінгапуру, який за короткий час став однією з найобговорюваніших компаній у Кремнієвій долині. Угода оцінюється приблизно в $2 млрд і підкреслює прагнення Марка Цукерберга зробити штучний інтелект ключовим бізнес-напрямом Meta.
Детальніше