Как часто вам шлют голосовые сообщения в Telegram вместо того, чтобы написать текст вручную? Мне – очень часто. Но если одни только так и общаются, экономя время на наборе сообщения и заодно передавая, как они говорят, живую эмоцию, я отношусь к голосовым довольно скептически. Во-первых, по голосовым невозможно искать, а, во-вторых, на их прослушивание приходится тратить кратно больше времени, чем на прочтение текстовых посланий, пытаясь выцепить из бесполезных междометий и «голосовых протяжек» основную информацию. Хорошо, что голосовые сообщения можно переводить в текст. Не знали? Сейчас научу.
Как вы, вероятно, знаете, Telegram славится обилием ботов. Это такие мини-приложения для мессенджера, которые отвечают за выполнение определённых задач. Есть бот Gmail, который позволяет получать входящую почту прямо в Telegram, есть бот Spotify, который позволяет слушать в интерфейсе мессенджера музыку из одноимённого сервиса, а есть боты – да, их много, — которые отвечают за расшифровку голосовых сообщений и транскрибирование, то есть перевод в текст. Они-то нам и нужны.
Телеграм-бот для расшифровки голосовых сообщений
Несмотря на то что ботов для перевода голосовых сообщений в текст очень много, работают они все плюс-минус одинаково, поэтому мы разберём принцип их работы на примере Voicy.
- Перейдите по этой ссылке и добавьте бота себе;
- Откройте чат с ботом и нажмите кнопку «Старт»;
- После активации бота перешлите в него голосовое;
- Дождитесь распознавания и прочитайте сообщение.
Разработчики Voicy утверждают, что их бот использует для распознавания речи самые продвинутые алгоритмы, но иногда качество перевода голоса в текст оставляет желать лучшего. Причём совершенно не понятно, по какому принципу возникают ошибки. Например, бот может распознать какие-то нетипичные слова вроде «пармиджано реджано», но ошибиться с распознаванием слова «сырок». Кроме того, у него совсем плохо с идентификацией аббревиатур и отдельных букв. Почему-то их он пытается превратить в отдельные слова.
Проблемы перевода голосовых сообщений в текст
Готовясь к написанию этой статьи, я попробовал попользоваться ещё и VoiceMsgBot. Это другой бот с функцией перевода голосовых сообщений в текст. Но мне он понравился ещё меньше. Как показал мой личный опыт, процент брака у него оказался даже выше, чем у Voicy. То есть многие из них сообщений, которые я пересылал ему для интерпретации, выходили совсем малопонятными. Нет, конечно, разобрать их смысл можно, но только если знать, о чём говорит ваш собеседник. В противном случае вам придётся просто переслушивать послание самому.
Что я могу сказать по поводу всех этих ботов-интерпретаторов? Ну, на самом деле это очень неоднозначная штука. Некоторые сообщения у них получается интерпретировать очень чётко и безошибочно, причём зачастую даже удивляешься, как им это удаётся. Однако время от времени они выдают такую дичь, что приходится самостоятельно возвращаться к сообщению и прослушивать его от и до, чтобы понять, о чём пытался сказать собеседник. Это занимает больше времени и очень неудобно. Поэтому ни Voicy, ни VoiceMsgBot назвать панацеей я не могу.
Нет комментарий