d0b8d0b7d0bcd0b5d0bdd18fd0b5d0bc d0b3d0bed0bbd0bed181 d0b2 d180d0b5d0b0d0bbd18cd0bdd0bed0bc d0b2d180d0b5d0bcd0b5d0bdd0b8 d0bfd180d0b8 6610b65a9256d

В мире современных технологий искусственного интеллекта реальное изменение голоса становится все более доступным. Программное обеспечение, речь о котором пойдет в данной статье, предлагает возможность производить голосовую конверсию в режиме реального времени с помощью различных искусственных интеллектуальных алгоритмов. Помимо этого, предлагается распределить нагрузку путем запуска AI на отдельном компьютере в качестве сервера, что позволит минимизировать влияние на другие ресурсоемкие процессы. Приложение совместимо с различными операционными системами, включая Windows, Mac, Linux и Google Colaboratory.

Приступим к реализации:
Открываем страницу приложения на Github, используя прямую ссылку:

d0b8d0b7d0bcd0b5d0bdd18fd0b5d0bc d0b3d0bed0bbd0bed181 d0b2 d180d0b5d0b0d0bbd18cd0bdd0bed0bc d0b2d180d0b5d0bcd0b5d0bdd0b8 d0bfd180d0b8 6610b65ae34bc

Опускаемся немного ниже, где находим различные версии. Выбираем последнюю стабильную, то есть без различных букв. В зависимости от вашей видеокарты необходимо загружать различные файлы:

d0b8d0b7d0bcd0b5d0bdd18fd0b5d0bc d0b3d0bed0bbd0bed181 d0b2 d180d0b5d0b0d0bbd18cd0bdd0bed0bc d0b2d180d0b5d0bcd0b5d0bdd0b8 d0bfd180d0b8 6610b65b3d6c3

После того, как Вы нашли нужный вариант, то нажимаем на «google» или «hugging face» для скачивания:

Изменяем голос в реальном времени при помощи AI

В случае с Google может быть ограничение на загрузку, тогда переходим на Hugging Face:

d0b8d0b7d0bcd0b5d0bdd18fd0b5d0bc d0b3d0bed0bbd0bed181 d0b2 d180d0b5d0b0d0bbd18cd0bdd0bed0bc d0b2d180d0b5d0bcd0b5d0bdd0b8 d0bfd180d0b8 6610b65bdf756

Находим нужный архив и загружаем его, после чего распаковываем:

d0b8d0b7d0bcd0b5d0bdd18fd0b5d0bc d0b3d0bed0bbd0bed181 d0b2 d180d0b5d0b0d0bbd18cd0bdd0bed0bc d0b2d180d0b5d0bcd0b5d0bdd0b8 d0bfd180d0b8 6610b65c3e7ad

Запускаем файл с названием «start_http.bat» и ожидаем окончания загрузки всех необходимых файлов, после чего у вас откроется пользовательский интерфейс:

d0b8d0b7d0bcd0b5d0bdd18fd0b5d0bc d0b3d0bed0bbd0bed181 d0b2 d180d0b5d0b0d0bbd18cd0bdd0bed0bc d0b2d180d0b5d0bcd0b5d0bdd0b8 d0bfd180d0b8 6610b65c855fa

Первым делом выбираем при помощи чего будет происходить рендер. Желательно иметь хорошую видеокарту, чтобы не было задержек:

d0b8d0b7d0bcd0b5d0bdd18fd0b5d0bc d0b3d0bed0bbd0bed181 d0b2 d180d0b5d0b0d0bbd18cd0bdd0bed0bc d0b2d180d0b5d0bcd0b5d0bdd0b8 d0bfd180d0b8 6610b65cdda8d

Указываем устройство ввода и вывода. Выбираем любой из понравившихся голосов и можно провести запись для проверки:

d0b8d0b7d0bcd0b5d0bdd18fd0b5d0bc d0b3d0bed0bbd0bed181 d0b2 d180d0b5d0b0d0bbd18cd0bdd0bed0bc d0b2d180d0b5d0bcd0b5d0bdd0b8 d0bfd180d0b8 6610b65d3521d

Если вас все устроило и Вы хотите выводить звук из AI в любое приложение, то необходимо загрузить и установить VB-CABLE:

d0b8d0b7d0bcd0b5d0bdd18fd0b5d0bc d0b3d0bed0bbd0bed181 d0b2 d180d0b5d0b0d0bbd18cd0bdd0bed0bc d0b2d180d0b5d0bcd0b5d0bdd0b8 d0bfd180d0b8 6610b65d79452

После чего изменяем устройство ввода в нужном приложении на «CABLE Output»:

d0b8d0b7d0bcd0b5d0bdd18fd0b5d0bc d0b3d0bed0bbd0bed181 d0b2 d180d0b5d0b0d0bbd18cd0bdd0bed0bc d0b2d180d0b5d0bcd0b5d0bdd0b8 d0bfd180d0b8 6610b65dd910e

В MMVCServerSIO изменяем «input» на свой вариант и «output» на «CABLE Input»:

d0b8d0b7d0bcd0b5d0bdd18fd0b5d0bc d0b3d0bed0bbd0bed181 d0b2 d180d0b5d0b0d0bbd18cd0bdd0bed0bc d0b2d180d0b5d0bcd0b5d0bdd0b8 d0bfd180d0b8 6610b65e2cad1

На этом все, приложение можно полноценно использовать!