Как переводить голосовые сообщения из Telegram в текст

Как набирать текст в Word голосом

За последние несколько лет в отношении улучшения распознавания голосового ввода компании Google удалось добиться впечатляющих результатов. Используя голосовой движок Google, вы можете набирать длинные сложные тексты с минимальным количеством ошибок, причём на самых разных языках мира и кажется просто удивительным, что подобную функцию в своём предназначенном для работы с текстом программном продукте до сих пор не реализовала компания Microsoft.

Впрочем, это не совсем так. Не так давно компания выпустила расширение с говорящим названием Microsoft Dictate, позволяющее набирать тексты в Word голосом, но оно не идёт ни в какое сравнение с голосовым движком Google. Если вы хотите реализовать голосовой ввод в Word, придётся поискать более эффективные инструменты или, в крайнем случае, отказаться от голосового набора в Microsoft Word в пользу онлайнового текстового редактора Google Docs, в котором эта функция действительно работает.

Телеграм-бот для расшифровки голосовых сообщений

Несмотря на то что ботов для перевода голосовых сообщений в текст очень много, работают они все плюс-минус одинаково, поэтому мы разберём принцип их работы на примере Voicy.

  • Перейдите по этой ссылке и добавьте бота себе;
  • Откройте чат с ботом и нажмите кнопку «Старт»;

Голосовые сообщения

Не забудьте выбрать язык голосовые сообщений

  • После активации бота перешлите в него голосовое;
  • Дождитесь распознавания и прочитайте сообщение.

Разработчики Voicy утверждают, что их бот использует для распознавания речи самые продвинутые алгоритмы, но иногда качество перевода голоса в текст оставляет желать лучшего. Причём совершенно не понятно, по какому принципу возникают ошибки. Например, бот может распознать какие-то нетипичные слова вроде «пармиджано реджано», но ошибиться с распознаванием слова «сырок». Кроме того, у него совсем плохо с идентификацией аббревиатур и отдельных букв. Почему-то их он пытается превратить в отдельные слова.

Бот, который переведет голосовые сообщения в ВК

Пользователи различных социальных сетей все чаще используют ввод голосовых сообщений. Не всегда человеку удобно напечатать текст своего месседжа, зачастую гораздо проще нажать кнопку с микрофоном и надиктовать свое послание. Но далеко не всегда есть возможность прослушать то, что было прислано другом. Вконтакте есть решение данной проблемы – бот, который переводит голосовые сообщения в текст. О том, как его использовать мы и поговорим в данной статье.

Выбор значка лупы

Заходим в свой аккаунт. Нажимаем на значок лупы, располагаемый в нижней части экрана.

«голосовые сообщения» в строке поиска

Прописываем в поисковую строку словосочетание «голосовые сообщения».

Выбор нужной группы

В самом верху находится нужная нам группа. Нажимаем по ее названию пальцем.

Выбор кнопки «Добавить в беседу»

Оказавшись на страничке нужного нам сообщества, нажимаем на кнопку «Добавить в беседу».

Выбор строки «Добавить в беседу»

В новом окне нам необходимо тапнуть по строке «Добавить в беседу».

Выбор нужной беседы

Открывается страница, в которой нам будут представлены все беседы, ведущиеся в последнее время. Выбираем нужную, нажав на нее пальцем. Беседа отмечается галочкой

Выбор галочки сохранения

Когда выбор был завершен, остается тапнуть по галочке, располагаемой в верхней части экрана справа.

Выбор отмеченного чата

Мы можем снова войти в окно добавления чатов, нажав кнопку «Добавить в беседу». Выбираем уже отмеченный чат.

Выбор строки «Полный»

Оказываемся на странице небольших настроек. Тут мы решаем, какой доступ будет иметь бот к нашей переписке. Можно выбрать строку «Только упоминания» или «Полный». Я выбираю второй вариант.

Выбор кнопки «Исключить»

Также в этом окне есть кнопка «Исключить». Ее можно нажать, если примите решение удалить бота из выбранной беседы.

Оповещение о том, что был приглашен «Бот Распознаватель / Голосовые сообщения в текст»

Заходим в «Сообщения». Видим, что в самом верху чатов располагается беседа, в которую был добавлен бот. Нажимаем на этот диалог. Открывается диалоговое окно, в котором есть оповещение о том, что владельцем аккаунта был приглашен «Бот Распознаватель / Голосовые сообщения в текст».

Выбор значка микрофона

Нажимаем на значок микрофона, который располагается в нижней части экрана, чтоб ввести голосовое сообщение.

Выбор кнопки «Разрешить»

Выскакивает окно, которое запрашивает разрешение на запись аудио приложением ВКонтакте. Нажимаем «Разрешить».

Выбор кнопки «Разрешить»

Появляется еще одно окно, в котором запрашивается доступ ВКонтакте ко всем файлам, мультимедиа и фото, размещенным на мобильном устройстве. Нажимаем «Разрешить».

Отправленное аудиопослание

Надиктовываем свое сообщение. Нажимаем на «птичку отправки». Видим, что было отправлено аудио послание.

«Ошибка распознавания»

Приходит сообщение от Бота, в котором написано: «Ошибка распознавания». Такое может произойти в случае, если человек надиктовывает свое послание слишком быстро или невнятно.

Оповещение об одном обработанном сообщении

В этом же сообщении от Бота нас оповещают о том, сколько аудиозаписей было распознано и прислано в текстовом режиме. На данный момент – это 1. Несмотря на то, что ожидаемый результат не был получен.

Расшифрованное сообщение от Бота

Совершаем еще одну попытку. Отправляем голосовое послание. Следом за ним приходит сообщение от Бота, в котором расшифровывается сказанное слово – «привет». Также тут есть информация о том, что программой уже было распознано два голосовых сообщения.

Теперь вы знаете, как перевести голосовое сообщение в текст Вконтакте. Помните о том, что рассматриваемый Бот применим только для групповых бесед. Для индивидуальных диалогов он не подходит. Не забывайте, что надиктовывать нужно разборчиво, иначе программа не распознает текст, выдаст «ошибку распознавания».

Голос -> текст: рабочие способы

Вариант 1: с помощью Google документов

Наиболее простой способ (и скорее всего, вам не понадобится ничего до-устанавливать) — это воспользоваться функциями Google, например, приложением Google-документы (на большинстве смартфонов оно уже предустановлено, что называется «из коробки»).

Для нашей текущей задачи — можно либо создать новый документ, либо открыть любой из имеющихся.

Новый документ

Далее обратите внимание на «кнопку» с микрофоном (в моем примере она расположена рядом с пробелом) — ее нужно зажать на 3-5 сек.

После, должна активироваться штатная функция Google — голосовой набор. Теперь телефон сможет перевести вашу речь в текст (причем, благодаря тому что мы открыли документ — весь текст автоматически будет сохранен).

Зажать кнопку с микрофоном

Зажать кнопку с микрофоном / Android 9.0

Примечание : если Google плохо воспринимает вашу речь — проверьте в настройках правильно ли указан язык (чаще всего, выбирают русский и английский). См. пример ниже.

Языки.

Вариант 2: с помощью ПО «прямая расшифровка»

Это приложение разработано Google для людей с нарушением слуха. В нем использованы спец. алгоритмы, позволяющие легко преобразовать обычный голос вашего собеседника в текст (даже если речь идет с акцентом!). Кстати, в этом же окне можно набрать свой ответ (текст) и с клавиатуры — это может быть полезно, при диалоге.

Примечание: для начала работы приложения — достаточно просто его запустить! См. скриншоты ниже.

Речь автоматически преобразовывается.

Речь автоматически преобразовывается.

Кстати, в настройках можно изменить размер шрифта, язык ввода, задать тему, возможность сохранения расшифровок и пр.

Настройки приложения - выбор языка и сохранения

Настройки приложения — выбор языка и сохранения

  1. приложение поддерживает 70 языков и диалектов;
  2. поддерживаются внешние микрофоны (в т.ч. Bluetooth версии);
  3. возможность работы сразу с несколькими языками;
  4. вибро-отклик;
  5. возможность печатать текст в самом приложении;
  6. работает на устройствах под управлением Android 5.0 (Lollipop) и выше.

Вариант 3: через переводчик

Этот способ хорош прежде всего для обмена небольшими короткими фразами (причем, даже в том случае, когда вам ненужно получить непосредственно сам перевод) . Ничего до-устанавливать на телефон ненужно, переводчик работает прямо в браузере.

Отмечу, что приложение может не только воспринимать речь и переводить ее в текст, но и сделать «что-то обратное» — прочитать вслух набранный текст (правда звучание всё же отличается от реального человека, но тем не менее. ).

Google-переводчик - пример работы

Google-переводчик — пример работы

Вариант 4: с помощью Яндекс-разговора

Это приложение удобно для постоянного использования. С его помощью можно прослушивать даже длинные лекции — каждая отдельная фраза (предложение) будет начинаться с новой строки (абзаца). Это довольно удобно!

Кстати, в приложении есть возможность набирать текст с клавиатуры, а потом озвучить его — приложение произнесет фразу довольно точно вслух.


Выводы

Несмотря на то, что до сих пор не существует способа, который бы обеспечил стопроцентное распознавание голоса в текст, за последние годы прогресс всё же наметился. Как мы могли убедиться, этому активно способствует корпорация Google. Создав свой Web Speech API, Гугл, практически открыл дорогу всем желающим для создания программ и сервисов перевода речи в текст. Причём, все они потенциально бесплатны!

Если Гугл не забросит развитие словарей распознавания голоса (как это у него, увы, часто бывало с другими проектами), то уже в ближайшем будущем у нас будет шанс получить качественные и бесплатные инструменты голосового ввода. Думаю, что так оно и будет, поскольку даже наш Яндекс ведёт активную работу в данном направлении. А, если будет конкуренция, то будет и развитие.

На сегодняшний же день мы уже можем использовать некоторые наработки, которые дают нам возможность распознавать речь с точностью от 60 до 90% (зависит от Вашей дикции и качества микрофона). В принципе, такой точности достаточно для надиктовки чернового варианта любого текста с последующей его правкой. Поэтому, если Вы до сих пор медленно печатаете, попробуйте голосовой ввод. Вполне возможно, что Вы будете очень довольны 😉

P.S. Разрешается свободно копировать и цитировать данную статью при условии указания открытой активной ссылки на источник и сохранения авторства Руслана Тертышного.

Оцените статью
Fobosworld.ru
Добавить комментарий

Adblock
detector