7 лучших голосовых помощников для вашего автомобиля — обзор компьютерщиков

Автомобильные компьютеры – именно здесь и прямо сейчас

Еще совсем недавно абсурдная затея установить машине полноценный ПК на глазах обрастает плотью и обзаводится душой. Энтузиасты уже давно придумали, как сделать машину вторым домом – и в отношении неизменного по сегодняшним меркам компьютера в том числе – но крупные бренды делают вид, что ничего подобного соорудить внутри автомобиля пока нельзя. Кто прав, кто виноват и, главное, что делать? Попробуем разобраться вместе.

Парадокс ситуации в том, что на первый взгляд компьютер в машине не нужен вообще никому. В первую очередь он не нужен производителям автомобилей. При том, что подобный девайс теоретически мог бы дать серьезное конкурентное преимущество, проблем он с собой притащит несоизмеримо больше.

Вспомним, что самое узкое место в этой индустрии — обслуживание реализованной продукции. Мощностей дилерских сервисных станций не хватает никому и никогда. И люди, которые только летом получали разбитый еще зимой «Форд Фокус» (для примера) знают об этом не понаслышке. Именно поэтому автопроизводители тратят огромное количество усилий на защиту машины от владельца, по большому счету идеальный клиент дилерского центра это тот, кто не знает, как выглядит гаечный ключ и отвертка.

И что будет, если дать этим людям в руки автомобильный ПК? Правильно, через неделю они объявятся в сервисном центре, причем привезут туда не компьютер, а всю машину целиком – в результате имеем ночной кошмар автодилера.

Системный блок автомобильного компьютера

У производителей головных устройств ситуация похожая, с той разницей, что они зачастую исходят из маркетинговых соображений. Возможности современных ГУ обслуживают квартет основных функций – музыку, видео, навигацию и беспроводную телефонную связь. Большинству пользователей ничего больше и не надо. Картинки посмотреть? Пожалуйста, большинство современных «голов» без проблем читают jpg. И опять-таки отношения с пользователями строятся как в советском анекдоте про первого вьетнамского космонавта: «А почему у вас руки такие синие?» — «Русская товарища бьет монтировкой по пальцам – ничего не трогай, собака!»

Но самое главное, что встроенный в автомобиль компьютер вроде как не слишком нужен и автовладельцам. Развлечения, навигация и Bluetooth наличествуют и в традиционных мультимедийных системах, а острое желание проверить почту можно удовлетворить посредством смартфона. Там же мессенджер, там же браузер. И зачастую современный человек, купивший уже три компьютера — домашний ПК, ноутбук и тот же коммуникатор – не слишком понимает, зачем тратиться на четвертый.

Системный блок SmartX-VD011

Штука в том, что неумолимая поступь технического прогресса имеет денежное выражение. Тот же телевизор в машине когда-то был у одного Элвиса Пресли, сегодня – у каждого пятого таксиста (в регионах они встречаются даже чаще, особенно там, где «кирпич на педаль газа и куда она из колеи денется»). А все потому, что головное устройство с небольшим монитором и встроенным ТВ-тюнером можно купить за полторы сотни баксов. С компьютером ситуация точно такая же.

Сколько стоит Pioneer AVIC-HD3BT, одна из самых мощных мультимедийных станций, снабженная помимо прочего жестким диском на 30 Гб? В худшем случае ее цена может переваливать за 60 тысяч рублей. Почем двухдиновый автомобильный моноблок, в котором есть примерно все тоже самое, плюс полноценная система под Windows XP? Примерно столько же. Уже интереснее, правда?

Системный блок SmartX-Pico

Теперь пара слов о том, чем может быть полезен автомобильный компьютер. Как ни странно, в первую очередь как раз навигацией. Основная проблема головных устройств, снабженных электронным проводником, в том, что навигационная система вшита туда намертво. И если в столице почти все они работают более менее сносно, то первые проблемы начинаются уже за кольцевой – олигофренические штатные системы даже на дорогих машинах уверены, что за МКАДом разумная жизнь отсутствует как класс.

Компьютер хорош тем, что на него без проблем можно поставить столько навигаторов, сколько душе угодно и общими усилиями они почти наверняка приведут, куда хочется. Хотя здесь тоже не все просто. Главным образом потому, что многие распространенные навигаторы – тот же «Автосупутник» — не работают под полноценной ОС.

Монитор для автомобильного компьютера

Тут есть два пути. С одной стороны, можно использовать все многообразие программ, способных взаимодействовать с традиционным ПК (для примера назовем City Guide, Be-On-Road и Gis RX). С другой – добавить к системе дополнительный блок, по устройству напоминающий КПК, который будет отвечать исключительно за прокладывание маршрутов.

В последнем случае возникает вопрос, а зачем при таком раскладе нужен сам компьютер? Хранилище архива музыкальных записей и фильмотеки, офисные приложения, графические редакторы, возможность копирования и записи информации – когда проводишь за рулем значительную часть суток, больше вопросов вызывает домашний комп, который большую часть времени выступает пылесборником. Месье, которые знают толк в автомобилях, могут использовать представленные возможности для оперативной диагностики и настройки мотора.

Системный блок DigitalCar в разобранном виде

При всем, как это не удивительно, широком разнообразии автомобильных компьютеров, их можно поделить на две основные группы: моноблоки (все в одном) и разнесенные системы (системный блок для скрытой установки и монитор на передней панели).

Что касается моноблоков, то судьба их до сих пор была яркой, но несколько трагичной. Она связана главным образом с продукцией корейского бренда Infill, который подарил человечеству на редкость удачную модель G4. Это, по форме, стандартное головное устройство формата 2 DIN, снабженное процессором с тактовой частотой 1,3 ГГц, возможностью установки 1 Гб оперативной памяти и жесткого диска SATA 2.5»объемом 200 Гб. В придачу ко всему G4 снабжен DVD-приводом и сенсорным 6,5-дюймовым дисплеем. Мало того, что разработка была удачна сама по себе, она неплохо вписывалась в парадигму ценностей опасливого до новинок потребителя. Магнитола она и есть магнитола, пусть даже с компьютером внутри.

К сожалению, компания Infill вошла в число первых жертв экономического кризиса, и примерно полгода назад производство этих устройств было приостановлено. Сейчас в продаже можно найти остатки старых запасов. Нишу пытаются занять несколько китайских брендов, но пока им не удается даже приблизиться к уровню Infill.

Моноблок Infill, выполненный как стандартное головное устройство формата 2 DIN

На рынке систем разнесенных все немного интереснее. Системные блоки для автомобильных компьютеров (на западе для этих устройств уже придумали восхитительно лаконичный термин carputer) производят несколько российских компаний. Вряд ли для кого-то станет удивительным тот факт, что автомобильные компьютеры напрямую произошли от домашних, которым, волею владельцев-энтузиастов, пришлось обживать багажники.

Промышленному подходу к вопросу благоприятствовало масштабное наступление IT-продукции по всем фронтам – как ни крути агрегатная основа аппарата для оплаты мобильника еще лет десять назад была бы пределом мечтания любого геймера. Следствием стал богатый выбор форм-факторов системных плат – создателям карпьютеров осталось лишь выбрать подходящие. Тем более, что производство начинки неизбежно сопровождается развитием всего, что должно к ней прилагаться – корпусов, портативных консолей, блоков питания и иже с ними.

Теперь о конкретике. Компания Smartecs готова порадовать целой линейкой системных блоков скрытой установки. Из всего многообразия отметим исключительно компактную модель SmartX-Pico – при габаритах 13х13х6 см она снабжена процессором с тактовой частотой 1 Гц, жестким диском на 250 Гб и 1 Гб оперативной памяти. Встроенный DVD-Rom отсутствует, зато наличествуют четыре разъема USB. Исследования патологоанатомического характера позволят обнаружить платы вроде тех, что используется в телевизорах Sony Bravia.

Еще одна ходовая модель именуется SmartX-VJ335 и по внешнему виду напоминает усилитель – мощный металлический корпус помогает конденсировать влагу, внутренности защищают пара кулеров, работающих на закачивание воздуха.

С воздухом у карпьютеров вообще особые отношения, все-таки автомобильным компьютерам приходится выживать в условиях частых и кардинальных смен температурного режима. Особенно если машина коротает зимние ночи вне пределов отапливаемого гаража.

Что касается характеристик, то по умолчанию полагается процессор с тактовой частотой 1.73 Ггц, 2 Гб оперативной памяти и жесткий диск емкостью 250GB. При желании все это можно менять как в большую, так и в меньшую сторону. Товар штучный, а потому любой каприз за ваши деньги, простите за банальность.

Что искать в автомобильном голосовом помощнике

Выбирая этот тип автомобильных аксессуаров, вы должны выбрать то, что соответствует вашему уровню комфорта. Вы будете взаимодействовать с этим устройством с помощью голосовых команд, чтобы держать руки на руле и смотреть на дорогу. Итак, если вы предпочитаете Alexa, приобретите устройство с поддержкой Alexa. Те, кто использует Google Assistant дома, должны получить наш выбор от Google.

  • Функции: Ищите автомобильные аксессуары, у которых есть дополнительные функции в дополнение к добавлению личного помощника к вашему автомобилю. У нас есть тот, который можно использовать как автомобильное зарядное устройство, видеорегистратор или динамик Bluetooth для вашего автомобиля.
  • Свободные руки: Следует избегать всего, что имеет слишком много кнопок или слишком сложно. И снова мы стараемся быть безопасными водителями и меньше отвлекаться.
  • Установка: И, наконец, выберите что-нибудь простое в использовании и установите. Мы выбрали только те предметы, которые просты в использовании. Не каждый может заменить свою стереосистему, поэтому вместо этого приобретите что-то вроде автомобильного зарядного устройства со встроенным Amazon Alexa. Таким образом, его легко установить и очень удобно.

Управление микроклиматом автомобиля

Прохладно в кабине? Не можете вспомнить, какая кнопка отвечает за подогрев воздуха? Или не хотите вычитывать эти загадочные символы на приборной панели? Просто попросите автомобиль сделать это за вас и пусть он беспокоиться о деталях. Многие авто будут реагировать даже на синонимы для этой команды, таких как «сделай теплее в авто» или «нагрей в салоне» (или наоборот, «сделай прохладнее» или «охлади в салоне»). Конечно, это немного похоже на разговор с не особо умным искусственным интеллектом, но это большой шаг вперед на пути к обеспечению бОльшего комфорта и безопасности дорожного движения.

Тестирование автопилотных моделей авто в мире уже идет полным ходом. Германия, США, Корея уже давно начали пробные поездки. И наша Москва не отстает.

Тесла проехала на беспилотнике 3-е транспортное кольцо в 2018 году. Программа отлично распознавала дорожную разметку, пешеходов, самостоятельно разгонялась и тормозила. Даже если водитель присутствует в машине, автопилот успешно выполняет управление. Интересная функция «режим утомления водителя», при которой программа «переживает», чтобы водитель не уснул и просит положить руки на руль во избежания засыпания человека.

Система голосового управления автомобилем: основные функции и направления развития

Российская компания «Яндекс» создала первое в России беспилотное такси. В том же 2018 машина на автопилоте проехала от Москвы до Татарстана. Город Иннополис стал первым городом в Европе, где можно заказать беспилотное такси! «Яндекс» работают на базе Камаз и Toyota.

Хоть такси беспилотное, но в салоне пока присутствует инженер, который в случае необходимости может переключить управление автомобилем на себя.

Конечно, мы еще не дошли до того момента, когда авто среднестатистического российского жителя может выполнять функцию личного шофера. Но GPS устройства в автомобилях стали довольно распространенными. И если вы планируете поездку по неизвестному маршруту, достаточно дать голосовую команду: «Проложи маршрут от Проспекта Ленина 11 до Площади Армейской 1». Предварительно хорошо бы сохранить такие ваши часто используемые данные, как адрес дома, работы, чтобы облегчить поиск, как это позволяет сделать Алиса от Яндекс в Навигаторе. И хоть иногда бывают некоторые сбои, вроде неправильно выбранного города и прочее, это все таки лучше, чем набирать на сенсорной клавиатуре адрес во время управления авто.

Сайт установщиков

Главная Автомобильные компьютеры, CarPC Статьи Что такое автомобильный компьютер (CarPC)

Основная задача, решаемая при помощи CarPC – это объединения всех мультимедийных, навигационных и прочих систем автомобиля с целью повышения комфорта и удобства пользования всеми этими системами. Кроме того, наличие автокомпьютера позволяет практически неограниченно расширять возможности этих систем, с легкостью добавлять новые системы, причем без необходимости внесения изменений в уже существующие модули. Многие из систем, реализуемых при помощи CarPC доступны и в виде отдельных решений (например, навигация, мультимедия). И, разумеется, можно пользоваться этими несколькими независимыми устройствами. Но, как правило, возможности всех этих устройств ограничены, и они не поддаются дальнейшей модернизации. В случае использования автокомпьютера — гибкость и масштабируемость всей системы в комплексе обеспечены. И, весьма немаловажный фактор, особенно критичный для автомобиля — удобство использования. Водителю должно быть максимально комфортно, а его внимание не должно рассеиваться. Компьютер для автомобиля позволяет сосредоточить управление всеми системами в одном месте, и предоставляет для этого удобный и интуитивно- понятный интерфейс, легко настраиваемый под персональные предпочтения пользователя. Данный интерфейс реализован на базе программно-аппаратного комплекса, состоящего из сенсорного монитора и программы-оболочки, являющейся «надстройкой» над операционной системой, и оптимизированного под сенсорный метод ввода (управление нажатием пальца).

Как правило, автомобильный компьютер состоит из практически такого же набора комплектующих, что и его настольные собратья. Однако, при подборе комплектующих для компьютера в машину уделяется особое внимание таким аспектам, как энергопотребление, тепловыделение, и габариты. Основные отличия заключаются в следующих компонентах:

1) В карпьютерах используются специальные сенсорные мониторы, позволяющие выполнять управление нажатием пальца, без необходимости использовать клавиатуру, мышь и прочие устройства ввода. Такое решение удобно как с точки зрения интерьера (выглядит как «штатный» монитор, не привлекая дополнительного внимания потенциальных злоумышленников), так и с точки зрения эргономики (нет путающихся проводов от клавиатуры или мыши, не нужно искать этот самый манипулятор, отвлекаясь во время движения). Монитор всегда находится в одном и том же месте, для выполнения каких-то типовых действий даже не нужно отрывать глаз от дороги (внимания требуется ровно столько же, сколько и для нажатия на клавишу Вашей магнитолы).

Такой блок питания не только обеспечивает CarPC стабилизированным напряжением 12В, но и позволяет управлять питанием CarPC и периферийных устройств в зависимости от состояния внешнего сигнала. Скажем, при повороте ключа в замке зажигания автокомпьютеру подается сигнал включения или выключения, что позволяет корректно завершить работу, после чего через заданный промежуток времени автокомпьютер отключается от сети, обеспечивая сохранность аккумуляторной батареи.

3) И, необязательным, но желательным отличием является носитель информации. Необходимо помнить, что условия использования компьютера в автомобиле сопряжены с вибрацией, тряской, агрессивным температурным режимом. Наиболее критично к этим факторам относится жёсткий диск. Поэтому, мы рекомендуем использовать в CarPC либо диски, адаптированные к таким условиям, либо воспользоваться альтернативным решением в виде SSD-диска (специализированные накопители на базе флэш-памяти). На данный момент стоимость SSD-диска все еще выше стоимости традиционного жесткого диска, при сравнимых характеристиках производительности. Но уже сегодня разумным решением является использование SSD-диска небольшого объёма в качестве системного, а дополнительного внешнего жесткого диска — в качестве хранилища данных пользователя (музыка, фильмы и т.п.).

Разумеется, для каждого пользователя приоритеты использования этих возможностей могут меняться в соответствии с его личными потребностями и предпочтениями. Более того, расширение возможностей CarPC обуславливается не только добавлением аппаратных средств или их модернизацией, но и изменением программной составляющей. Эта часть имеет поистине огромное значение, и именно она позволяет пользователю не просто обладать какими-то возможностями, но и пользоваться ими максимально комфортабельным способом. Однако, условно все основные функциональные возможности CarPC можно разделить на 5 групп:

– возможность использования различных навигационных программ на выбор пользователя, простое и удобное обновление карт, POI, радаров, импорт экспорт треков, отображение информации о пробках в реальном времени

— интеграция с автомобильной аудиосистемой, удобное управление, проигрывание любых форматов аудио- и видеоматериалов, возможность раздельного вывода изображения на дополнительные мониторы (например, для задних пассажиров).

– различные способы доступа в сеть (Wi-Fi, Wi-Max, GPRS/EDGE/3G/CDMA), как при помощи специальных адаптеров, так и используя имеющееся оборудование (например, при помощи сотового телефона). Реализуется возможность использовать CarPC в качестве полноценного мобильного офиса.

– подключение одной или нескольких камер, позволяющих вести запись дорожной обстановки, в том числе и в фоновом режиме. Автоматическая активация тыловой камеры при включении задней передачи.

– тесная интеграция с массой дополнительных устройств – парктроники, диагностика автомобиля через OBD-II, датчики давления в шинах, и многое другое.

– карпьютер, собранный в компактном корпусе, размером с обычную магнитолу. Основным преимуществом подобного решения является возможность расположения на лицевой панели аппаратных клавиш и информационного дисплея.

– решение «всё-в-одном», максимально простое в установке и совместимое со всеми автомобилями, имеющими места 2 DIN. Помимо самого карпьютера, включает в себя монитор на лицевой панели, усилитель, FM-тюнер, зачастую комплектуется приводом оптических дисков, ТВ-тюнером, GPS-приемником, и некоторыми другими дополнительными устройствами.

– наиболее богатое по своим возможностям решение, дающее свободу выбора при подборе компонентов, и позволяющее выполнить установку в соответствии с особенностями конкретного автомобиля.

Варианты отображения и управления

– для вывода информации и сенсорного ввода используется специальный автомобильный сенсорный монитор, который обладает хорошими характеристиками – разрешением, яркостью, углами обзора. Однако, установка монитора является одной из самых трудоемких задач при интеграции CarPC. Как правило, панель автомобиля дорабатывается вручную, при помощи резки, лепки и покраски, установленный монитор выглядит как штатное устройство.

Впрочем, существуют «выезжающие» мониторы, устанавливаемые в гнездо 1 или 0,5 DIN, и позволяющие не вносить необратимых изменений в интерьер автомобиля.

– многие современные автомобили уже имеют монитор. Несмотря на то, что их характеристики, как правило, заметно хуже, чем у их специализированных собратьев, их замена не всегда является приемлемым решением. Например, на этот штатный монитор может быть завязано управление какими-либо функциями автомобиля (климат-контроль, радио, и т.п.). В таком случае, компромиссным вариантом является подключение CarPC к штатному монитору при помощи специальных адаптеров.

История голосового управления: когда мы начали пытаться говорить с машинами и как они научились нас слышать

В 1970-х общение с роботами казалось научной фантастикой: R2D2 и C3PO из «Звёздных войн», способные понимать и говорить, были героями далекого будущего. На самом деле технологии распознавания голоса существовали тогда уже больше двух десятилетий, а синтезом речи учёные занялись еще в XVIII веке. Ну а сегодня прохожий, разговаривающий с умными часами, уже не вызывает удивления. Рассказываем, как человек учил машины общаться: от первых искусственных звуков до персональных виртуальных ассистентов.

1773: Первые попытки научить машины говорить

Первым имитировать человеческое общение с помощью техники попытался в 1773 году немецкий учёный Христиан Кратценштейн, работавший в России. Он изобрёл синтезатор речи на основе трубок органа, который издавал гласные звуки: а, э, и, о, у. Металлические детали резонировали в трубах подобно голосовым связкам. Ещё одно раннее изобретение — говорящая машина австрийца Вольфганга фон Кемпелена 1791 года. Меха подавали воздух на металлический язычок, а человек помогал аппарату генерировать нужные звуки, прикрывая клапан ладонью: устройство произносило простые слова, например «мама» и «папа».

Говорящая машина Кемпелена, экспонат Deutsches Museum, Мюнхен

В XX веке на смену механическим машинам пришли электрические. В 1922 году появилась схема английского физика Джона Стюарта: она издавала несколько гласных звуков с помощью резонаторов — подобно радиоприёмнику. А в 1938 году представили синтезатор на электронных осцилляторах и фильтрах, способный произносить любые слова. Машина Voder, напоминавшая фортепиано, даже умела петь. Её разработала компания Bell Laboratories, которая сейчас называется Nokia Bell Labs.

1952: Audrey от Bell Labs — машина, которая понимает речь

Поняв физику электронного синтеза речи, ученые начали описывать ее формантами — наборами резонансных частот звуков, которые создают связки, язык и губы. Эти описания стали основой технологии распознавания: в 1952 году машина Audrey от Bell Laboratories понимала, когда человек называет цифры от 0 до 9. Audrey воспринимала форманты говорящего и сравнивала их с образцами. Устройство работало точнее, когда слова произносил человек, чьи записи использовались как эталонные. Так возникла задача, которую будут решать в течение следующих десятилетий: научить машины распознавать форманты одних и тех же слов у разных людей.

Графические описания формант слов, обозначающих цифры

1962: IBM Shoebox — появление голосового управления

В 1962 году технологию распознавания голоса публично представила корпорация IBM. Экспериментальная машина Shoebox (дословно – коробка от обуви, по габаритам аппарата) понимала 16 слов: цифры и команды для операций с числами, такие как «плюс», «минус» и «равно». Shoebox принимала речь с помощью микрофона, передавала команды на счетное устройство, которое печатало ход и результаты арифметических операций на бумаге.

Работу Shoebox демонстрировали по телевидению и на Всемирной выставке 1962 года в Сиэтле. Фото из архива IBM

В 1960–1970-х годах идея голосового управления стала популярной благодаря голливудским блокбастерам. Один из самых известных — «Космическая одиссея 2001 года» Стенли Кубрика. В фильме компьютер HAL синтезирует и распознает беглую человеческую речь — совсем как живой. Позднее общающиеся роботы R2D2 и C3PO появились в «Звёздных войнах» Джорджа Лукаса.

1971: Harpy — государственный проект и новый алгоритм

Разработкой технологий распознавания голоса заинтересовалось Министерство обороны США. В рамках программы DARPA Speech Understanding Research (SUR) в 1971 году разработали систему Harpy. Она понимала 1011 слов. Всё благодаря новому подходу: подобие записанных слов сравнивали с эталонами при помощи теории графов. С алгоритмом «поиск луча» (beam search) машина способна воспринимать речь по частям, исходя из синтаксиса и разных форм слов. «Поиск луча» также используют в машинном переводе. Несмотря на новаторство, система всё ещё была исследовательской и была непригодна для коммерческого использования.

1986: IBM Tangora — пишущая машинка с большим словарным запасом

В 1970-х к IBM присоединился Фред Йелинек из Корнелльского университета. Он считал, что в новых разработках нужно отказаться от «подражания» человеческой речи. Он начал искать способы распознавания, основанные на работе компьютера, — и в 1986 году создал пишущую машинку Tangora с голосовым управлением.

В Tangora работал статистический алгоритм на основе скрытой модели Маркова: компьютер рассчитывал вероятности того, что воспринимаемый звук будет частью какого-то слова. Изобретение позволило серьёзно расширить словарный запас: Tangora понимала 20 тысяч слов и несколько предложений. Машинка обучалась под работу с новым пользователем в течение 20 минут. Исследователи начали применять её в своей работе: рабочие станции Tangora на основе компьютеров IBM помогали создавать текстовые документы голосом.

1987: Джули — умная кукла

В 1987 году компания Worlds of Wonder выпустила в продажу умеющих общаться кукол Джули. Электроника внутри понимала 16 слов и отвечала с помощью синтезатора речи. Датчики помогали умной кукле «отличать» день от ночи, а также «чувствовать» холод и тепло — так разговоры получались содержательными. Как и машинку Tangora, Джули нужно было обучать под голос конкретного человека.

До 1980-х разработчики в основном занимались методами преобразования звуковых волн в текст. После появления массовых устройств исследователи начали изучать пользовательский опыт. Выяснилось, что с машинами люди говорят так же, как друг с другом: с упрощённым синтаксисом и искажением литературного языка. Для корректного диалога устройствам не хватало словарного запаса и способности понимать нестандартные речевые конструкции. Ограничения были связаны прежде всего с низкой производительностью процессоров.

1990–1997: Dragon NaturallySpeaking — непрерывный распознаватель речи

С распространением интернета и персональных компьютеров технологии распознавания голоса начали развивать как программное обеспечение — так в 1990 году появилась Dragon Dictate. Супруги Джеймс и Джанет Бейкеры разрабатывали подобные программы с 1977 года, но для полноценной работы компьютерам не хватало мощности процессоров и оперативной памяти. Dragon Dictate работала на операционной системе DOS и распознавала 30 тысяч слов естественного языка. Слова приходилось чётко выговаривать и диктовать по одному.

В 1997 году систему улучшили — появилась Dragon NaturallySpeaking (DNS). Первые версии уже распознавали непрерывную речь — до 100 слов в минуту. Для корректной работы пользователь тренировал программу в течение 45 минут. DNS стала коммерчески успешной — и совершенствуется до сих пор.

2008–2011: Голосовые помощники Google, Apple и другие

В 2000-х технологию развивали с помощью машинного обучения. В 2008 году Google создал Voice Search — программу голосового управления для iOS: собственной мобильной операционной системы у компании не было. На тот момент в iPhone уже были подобные приложения, например SayWho. Но Voice Search отличался инновациями. Он использовал GPS-датчик для более точных ответов на запросы, такие как «Где ближайший Starbucks?». К тому же, Voice Search был облачным: запись голоса обрабатывалась не на iPhone, а отправлялась на серверы Google.

Эпоха смартфонов дала голосовому управлению полноценное применение. Появились настоящие виртуальные ассистенты, помогающие использовать разные функции смартфона через речевые команды.

Позднее Google стал использовать своего голосового помощника на Android. Компания Apple разработала собственную технологию, в 2011 году представив Siri — первого помощника с узнаваемым голосом. На английском языке Siri говорит голосом Сьюзан Беннетт — актрисы озвучивания рекламных роликов. Спустя несколько лет голосовыми помощниками обзавелись и другие IT-гиганты: в 2014 году Microsoft представил Cortana, а Amazon — Alexa. Позднее технологией заинтересовались и российские компании — появились голосовые помощники Алиса, Маруся и Олег.

Рынок устройств с технологиями распознавания речи растёт: их используют не только в качестве голосовых помощников в гаджетах, но и для управления беспилотными автомобилями и даже в автоматизации производств. По прогнозам экспертов, к 2025 году размер мирового рынка технологий распознавания голоса составит $27,16 млрд. Для сравнения: в 2019 году он был почти в три раза меньше — $10,7 млрд.

А голосовые ассистенты, которые раньше могли выполнять ограниченный круг задач, становятся умнее с каждым днём. Благодаря прорыву в синтезе речи их голоса сегодня звучат естественнее, а из программ, способных только ставить будильник и совершать звонки, они превратились в полноценных помощников.

Мы в SberDevices развиваем целое семейство виртуальных ассистентов с тремя персонажами — это Сбер, Джой и Афина. Сейчас технологии позволяют наделять ассистентов характерами, чтобы дать пользователям возможность выбрать близкого по духу персонажа. Способы взаимодействия тоже изменились: если первые голосовые помощники могли понимать только речь (и то не всегда хорошо), то с современными ассистентами можно общаться ещё и жестами. Для этого, разумеется, нужна камера — о том, как это работает у нас, мы уже рассказывали. И, конечно, виртуальные ассистенты сегодня умеют гораздо больше, чем их предшественники: они живут в банковских приложениях и помогают управлять финансами, а ещё — умеют заказывать еду, рекомендовать подходящий контент и многое другое.

Оцените статью
Fobosworld.ru
Добавить комментарий

Adblock
detector