Top.Mail.Ru
Курс «10 задач на фрилансе»
Начните зарабатывать на нейросетях уже завтра
Урок №2
«Транскрибация аудио и видео»
Транскрибация — перевод видео- или аудиофайла в письменный текст.

Это одна из самых популярных задач для фрилансеров, таких заказов всегда миллионы. Раньше для этого приходилось самому сидеть, все слушать и записывать вручную, но теперь с этим отлично справляются нейросети.

Крутой и бесплатный вариант — Whisper Jax, хотя есть и другие похожие нейросети. Принцип работы у них один: помещаете в нужное окно ссылку на ролик с YouTube, аудио- или видеофайл и выбираете transcribe, то есть транскрибировать, а потом submit. Потом немного ждете и получаете транскрибированный текст. Большие файлы — например, длиной 40 минут и больше — лучше разбить его на части, чтобы облегчить процесс транскрибации.

Таких заказов, как я уже говорил, всегда очень много. Бизнес использует эти материалы в SEO и публикует статьи на основе конференций, выступлений и так далее. А это — экспертный контент, который дает бизнесу нарабатывать репутацию и клиентов. Вдобавок это один из самых дешевых для бизнеса способов создать контент, поэтому он так популярен.

Практика

Давайте попробуем транскрибировать видео с Ютуба. Выбираем из трех верхних вкладок YouTube, вставляем ссылку на видео и нажимаем Submit. Когда процесс закончен, в правой части экрана у вас появится полотно текста. Осталось разбить его на смысловые части и немного подредактировать. Этим мы и займемся в следующей задаче.

Очень редко, но бывает, что звук в вашем видео настолько отвратительный, что Whisper JAX не может его правильно транскрибировать и выдает непонятно что. Что делать в этом случае? Возьмите файл с плохим звуком и отправьте его в сервис Auphonic. Он отлично умеет исправлять звук, убирать лишние шумы и так далее. После этого вы скачиваете получившийся файл с теперь уже хорошим звуком и идете обратно в Whisper JAX. Готово, вы восхитительны!