MacWhisper навчилося перетворювати розмови в текст за кілька секунд

MacWhisper

Програма MacWhisper, відома як один із найзручніших способів транскрипції аудіо на комп’ютерах Mac, отримала потужне оновлення. Тепер вона підтримує Parakeet — надшвидку модель штучного інтелекту від Nvidia, яка здатна обробляти до 60 хвилин аудіо всього за одну секунду (за наявності відповідного графічного процесора). Про це пише 9to5Mac.

Що таке модель Parakeet?

Parakeet — це новітня модель автоматичного розпізнавання мовлення від Nvidia, представлена у травні 2025 року. Вона обіцяє феноменальну швидкість транскрипції, зокрема при використанні таких GPU як A100, H100, T4 або V100.

До цього часу Parakeet була доступна переважно через open-source інструменти, що вимагали командного рядка та налаштувань вручну. Проте з виходом оновлення MacWhisper 1.3 цю технологію інтегровано у зручний інтерфейс для користувачів macOS.

Переваги нового оновлення MacWhisper

Завдяки співпраці з командою Argmax, MacWhisper тепер надає змогу Pro-користувачам використовувати Parakeet напряму в застосунку. За словами розробника Жорді Бруїна, результат — справді вражаючий:

«MacWhisper тепер підтримує модель Parakeet. Ми змогли транскрибувати 30-хвилинний подкаст менше ніж за 8 секунд», — зазначив Бруїн.

У тесті на MacBook Pro з чіпом M2 Pro застосунок обробив 3-годинний випуск подкасту за 1 хвилину 22 секунди, включаючи розпізнавання мовців.

Parakeet проти Whisper: технологічна еволюція

Whisper — серія моделей OpenAI, яка стала проривом у транскрипції у 2022–2023 роках, — поступово відходить у минуле. Зосередившись на GPT‑4o та нових комерційних напрямках, OpenAI припинила розвиток Whisper, відкривши простір для нових гравців.

Parakeet — яскравий приклад цієї нової хвилі. Її продуктивність перевершує попередні моделі і дає змогу здійснювати транскрипцію у режимі, близькому до реального часу.

Обмеження та плани на майбутнє

На момент запуску Parakeet у MacWhisper підтримує лише англійську мову. Проте розробники обіцяють багатомовну версію найближчим часом.

Також слід враховувати, що функціональність доступна лише у платній версії MacWhisper Pro.


Телеграм double.newsТелеграм double.news

Схожі Новини
Drive and Listen

Drive and Listen: катайтесь вулицями Лондона, Берліна, Токіо та слухайте місцеве радіо

Уявіть, що ви їдете вузькими вуличками Парижа, швидкісними магістралями Лос-Анджелеса чи серед жвавого натовпу Токіо, а з динаміків лунає місцеве радіо. Вам не потрібно бронювати квитки чи збирати валізи – усе це можливо завдяки сервісу Drive and Listen.
Детальніше
QR код

Як сканувати QR-код за допомогою смартфона: швидка інструкція

QR-коди давно стали частиною повсякденного життя — від меню в кафе до швидкої авторизації в застосунках. Але не всі знають, як правильно їх сканувати зі свого смартфона. У цій статті пояснюємо, як це зробити на iPhone та Android, без додаткових програм.
Детальніше