MacWhisper навчилося перетворювати розмови в текст за кілька секунд

MacWhisper

Програма MacWhisper, відома як один із найзручніших способів транскрипції аудіо на комп’ютерах Mac, отримала потужне оновлення. Тепер вона підтримує Parakeet — надшвидку модель штучного інтелекту від Nvidia, яка здатна обробляти до 60 хвилин аудіо всього за одну секунду (за наявності відповідного графічного процесора). Про це пише 9to5Mac.

Що таке модель Parakeet?

Parakeet — це новітня модель автоматичного розпізнавання мовлення від Nvidia, представлена у травні 2025 року. Вона обіцяє феноменальну швидкість транскрипції, зокрема при використанні таких GPU як A100, H100, T4 або V100.

До цього часу Parakeet була доступна переважно через open-source інструменти, що вимагали командного рядка та налаштувань вручну. Проте з виходом оновлення MacWhisper 1.3 цю технологію інтегровано у зручний інтерфейс для користувачів macOS.

Переваги нового оновлення MacWhisper

Завдяки співпраці з командою Argmax, MacWhisper тепер надає змогу Pro-користувачам використовувати Parakeet напряму в застосунку. За словами розробника Жорді Бруїна, результат — справді вражаючий:

«MacWhisper тепер підтримує модель Parakeet. Ми змогли транскрибувати 30-хвилинний подкаст менше ніж за 8 секунд», — зазначив Бруїн.

У тесті на MacBook Pro з чіпом M2 Pro застосунок обробив 3-годинний випуск подкасту за 1 хвилину 22 секунди, включаючи розпізнавання мовців.

Parakeet проти Whisper: технологічна еволюція

Whisper — серія моделей OpenAI, яка стала проривом у транскрипції у 2022–2023 роках, — поступово відходить у минуле. Зосередившись на GPT‑4o та нових комерційних напрямках, OpenAI припинила розвиток Whisper, відкривши простір для нових гравців.

Parakeet — яскравий приклад цієї нової хвилі. Її продуктивність перевершує попередні моделі і дає змогу здійснювати транскрипцію у режимі, близькому до реального часу.

Обмеження та плани на майбутнє

На момент запуску Parakeet у MacWhisper підтримує лише англійську мову. Проте розробники обіцяють багатомовну версію найближчим часом.

Також слід враховувати, що функціональність доступна лише у платній версії MacWhisper Pro.

Схожі Новини
Восьминіг

Інженери створили присоску, що імітує восьминога: прорив у м’якій робототехніці

Інженери та науковці дедалі частіше звертаються до природи у пошуках ідей для нових технологій. Зокрема, восьминоги, здатні прикріплюватися до найскладніших поверхонь, стали натхненням для створення нових типів присосок, які мають змінити підхід до захвату предметів м’якими роботами.
Детальніше
Windows 11

Microsoft стверджує, що Windows 11 у 2 раза швидша за Windows 10 — але бенчмарк використовує різні процесори

У своєму новому блозі Microsoft заявила про значне зростання продуктивності після переходу з Windows 10 на Windows 11 — до 2,3 раза швидше. Проте це твердження викликало критику через суперечливу методологію тестування: порівняння проводилось на різних поколіннях процесорів, що суттєво впливає на результати.
Детальніше