d0bfd0bed0bbd183d187d0b0d0b5d0bc d182d0b5d0bad181d182 d0b8d0b7 d0bbd18ed0b1d0bed0b9 d0b0d183d0b4d0b8d0bed0b4d0bed180d0bed0b6d0bad0b8 6610b82e5ecde

В наше время возможности искусственного интеллекта расширяются с каждым днем, и это открывает новые горизонты в области автоматической обработки различных данных. Одной из интересных разработок в этой области является нейронная сеть Whisper JAX от компании OpenAI. С ее помощью теперь можно легко получить текст из любой аудиодорожки всего за несколько кликов. В данной статье мы рассмотрим, как работает этот сервис и как его можно использовать.

Приступим к реализации:
Открываем страницу проекта на Hugging Face, используя прямую ссылку и ожидаем небольшой загрузки:

Получаем текст из любой аудиодорожки

После загрузки сверху можно выбрать один из доступных источников для обработки аудиодорожки. Можно использовать микрофон, готовый аудиофайл или URL—адрес, ведущий на Youtube видео:

d0bfd0bed0bbd183d187d0b0d0b5d0bc d182d0b5d0bad181d182 d0b8d0b7 d0bbd18ed0b1d0bed0b9 d0b0d183d0b4d0b8d0bed0b4d0bed180d0bed0b6d0bad0b8 6610b82f02124

К примеру, воспользуемся загрузкой с файла. Нажимаем, чтобы указать путь до необходимого файла или же просто перетаскиваем его в специальное окно:

d0bfd0bed0bbd183d187d0b0d0b5d0bc d182d0b5d0bad181d182 d0b8d0b7 d0bbd18ed0b1d0bed0b9 d0b0d183d0b4d0b8d0bed0b4d0bed180d0bed0b6d0bad0b8 6610b82f514db

Выбираем одну из задач, в нашем случае это «transcribe». Помимо этого можно добавить временные метки, для этого ниже есть специальная галочка:

d0bfd0bed0bbd183d187d0b0d0b5d0bc d182d0b5d0bad181d182 d0b8d0b7 d0bbd18ed0b1d0bed0b9 d0b0d183d0b4d0b8d0bed0b4d0bed180d0bed0b6d0bad0b8 6610b82f95c14

Опускаемся еще немного ниже и нажимаем на кнопку «Исполнить». Ожидаем, время будет зависеть от величины вашего аудиофайла и загруженности сети:

d0bfd0bed0bbd183d187d0b0d0b5d0bc d182d0b5d0bad181d182 d0b8d0b7 d0bbd18ed0b1d0bed0b9 d0b0d183d0b4d0b8d0bed0b4d0bed180d0bed0b6d0bad0b8 6610b82fcefe4

После этого получаем готовую транскрипцию, которую можно сразу же скопировать, используя кнопку в правом верхнем углу:

d0bfd0bed0bbd183d187d0b0d0b5d0bc d182d0b5d0bad181d182 d0b8d0b7 d0bbd18ed0b1d0bed0b9 d0b0d183d0b4d0b8d0bed0b4d0bed180d0bed0b6d0bad0b8 6610b8301bbfe

Процесс с Youtube видео не сильно отличается, вставляем ссылку и повторяем те же действия:

d0bfd0bed0bbd183d187d0b0d0b5d0bc d182d0b5d0bad181d182 d0b8d0b7 d0bbd18ed0b1d0bed0b9 d0b0d183d0b4d0b8d0bed0b4d0bed180d0bed0b6d0bad0b8 6610b8307ca3c

Справа получаем итоговый результат с временными отметками, если они были Вам необходимы:

d0bfd0bed0bbd183d187d0b0d0b5d0bc d182d0b5d0bad181d182 d0b8d0b7 d0bbd18ed0b1d0bed0b9 d0b0d183d0b4d0b8d0bed0b4d0bed180d0bed0b6d0bad0b8 6610b830bd082

На этом все, надеюсь статья оказалась для Вас полезной!