Как происходит общение с искусственным интеллектом

Как происходит общение с искусственным интеллектом

Подлинное общение с искусственным интеллектом имеет амбициозную цель на протяжении десятилетий и несет большой потенциал для своего будущего.
Тем не менее, по состоянию на сейчас только природа по-прежнему остается единственным успешным создателем систем способных к искусству общения.

общение с искусственным интеллектом

Наблюдая за естественными коммуникативными процессами ученые предполагают целостный взгляд, объединяющий различные средства и уровни коммуникации. Однако, пока это всего лишь имитация действующей модели мышления человека выраженная в компьютерной форме в виде цифровых технологий.
Паттерны или шаблоны различных чувств, а также огромное количество контекстуальной информации интегрированы в компьютерные программы общения с виртуальным помощником, чтобы дать приблизительное понимание реальности.

Первый тип ИИ: реактивные машины

Самые базовые типы систем ИИ сугубо реактивны и не могут ни формировать воспоминания, ни использовать прошлый опыт для информирования текущих решений. Deep Blue, играющий в шахматы суперкомпьютер IBM, который обыграл гроссмейстера Гарри Каспарова в конце 1990-х, — это прекрасный пример такого типа машин.

Deep Blue может идентифицировать фигуры на шахматной доске и знает, как они двигаются. Он может делать прогнозы ходов, как своих, так и оппонента. И выбирает наиболее оптимальные ходы из возможных.

Однако он не имеет никакого представления о прошлом и памяти произошедшего. Если не считать редко используемого специфического для шахмат правила не повторять один и тот же ход три раза, Deep Blue игнорирует все, что было до текущего момента. Он просто смотрит на фигуры на шахматной доске и выбирает следующий ход.

Такой тип интеллекта включает компьютер, непосредственно воспринимающий мир и действующий на основании того, что он видит.

Он не опирается на внутреннюю концепцию мира. В своей работе исследователь ИИ Родни Брукс утверждал, что мы должны строить только такие машины. По его мнению, люди не очень хороши в программировании точных моделируемых миров для компьютеров, как говорят, в создании «репрезентации», представления мира.

Современные интеллектуальные машины, которыми мы восхищаемся, либо не имеют такой концепции мира, либо она очень ограничена и касается определенных задач. Инновации в дизайне Deep Blue заключались не в том, чтобы расширить число возможных ходов, которые рассматривает компьютер. Вместо этого разработчики нашли способ сузить его видение, чтобы отказаться от некоторых возможных ходов в будущем в зависимости от того, как они оцениваются.

Точно так же и AlphaGo Google, который обыграл чемпиона мира по го, не может оценивать возможные будущие ходы. Его метод анализа более изощренный, чем у Deep Blue: он использует нейронную сеть для оценки разворачивания игры.

Эти методы улучшают возможности систем ИИ, позволяют лучше играть в определенные игры, но их непросто изменить или применить к другим ситуациям. Эти компьютерные типы воображения не имеют концепции мира в целом — и значит, они не могут выходить за рамки выполнения определенных задач, для которых их сделали, и их легко одурачить.

Они не могут интерактивно участвовать в мире, а нам хотелось бы однажды увидеть именно такие системы ИИ. Вместо этого машины будут вести себя точно так же, как и всегда, сталкиваясь с одной и той же ситуацией. Если мы хотим сделать систему ИИ надежной и заслуживающей доверия, то это хорошо: вы хотели бы, чтобы ваш автономный автомобиль был надежным. Но если мы хотим, чтобы машины взаимодействовали с нами и с миром, это плохо. Простейшие системы ИИ никогда не заскучают, их нельзя заинтересовать или расстроить.

На что способен искусственный интеллект уже сейчас

Оценить динамику может каждый, кто пользуется автоматическими переводчиками. Еще лет пять назад Google Translate более-менее сносно справлялся с отдельными наборами фраз и предложениями, тогда как сегодня программа переводит большие смысловые блоки, нейросети учитывают контекст, оперируют огромными массивами статистических данных. Сейчас можно читать статьи на хинди, китайском, арабском, не зная языка.

ИИ давно используется в финансовой сфере для оценки платежеспособности заемщика. Есть вам отказали в выдаче кредита на первом этапе ― вас отсеял именно искусственный интеллект. В США в некоторых штатах ИИ применяют в судебной системе для оценки продолжительности тюремных сроков для обвиняемых.

Алгоритмы помогают врачам ставить диагнозы. Например, «СберМедИИ» (входит в экосистему «Сбера») и Лаборатория по искусственному интеллекту Сбербанка совместно разработали приложение AI Resp: нейросеть анализирует голос пациента, дыхание и кашель, чтобы определить вероятность коронавирусной инфекции. Ранее Лаборатория по ИИ и «СберМедИИ» представили онлайн-сервис «КТ Легких», определяющий локализацию и степень поражения легких для диагностики вирусной пневмонии, в том числе COVID-19, по снимкам компьютерной томографии. Также при использовании этого сервиса ИИ позволяет выявлять онкологические заболевания на ранней стадии при анализе КТ грудной клетки и может помогать врачам при диагностике.

На данный момент разработано несколько значимых технологий в сфере искусственного интеллекта.

  • GPT-3 из области естественной обработки языка (NLP), самая сложная и в то же время гибкая нейронная сеть, способная генерировать статьи почти по любой теме, которые на первый взгляд трудно отличить от созданных человеком.

Фото:Shutterstock

  • Нейросеть AlphaFold 2, ставшая прорывом в медицинской науке, способна определять трехмерную структуру белка с высокой точностью всего за несколько часов, в сравнении с традиционными методами.
  • Алгоритмы AutoML (автоматизированное машинное обучение) сделали ИИ доступным малому и среднему бизнесу благодаря интеграции с облачными системами (например, MLSpace от SberCloud, Microsoft Azure или AutoML от Google). Используя среду разработки, предприятия могут написать свои алгоритмы, к примеру, для обработки обращений клиентов или улучшения прогнозирования спроса.

Искусственный интеллект превосходит людей по IQ и креативности: в викторинах он набирает на 40% больше баллов, по вопросам SAT (тест для оценки знаний абитуриентов США) — на 15% больше баллов, чем средний абитуриент колледжа.

Как устроены технологии разговорного AI?

Кратко схему взаимодействия пользователя и, например, чатбота можно представить так:

Первоначально пользователь адресует свой запрос в какой-либо из доступных ему каналов. За запросом стоит некое намерение, интент, т.е. желание получить ответ на вопрос, получить услугу, товар или какой-либо контент, например, музыку или видео. В качестве каналов могут выступать умные устройства, ассистенты, встроенные в устройства или мобильные телефоны, привычный звонок на номер телефона, мессенджеры или вебчаты, подобные популярным в России Livetex, Jivosite или Webim.

Далее, может потребоваться дополнительная обработка или конвертация формата сообщения. Диалоговые платформы всегда работают с текстом, в то время как ряд каналов предполагают голосовое общение. За эту конвертацию отвечают платформы ASR (распознавание речи), TTS (синтез речи), системы интеграции с телефонией. В некоторых случаях может быть необходимо узнавать собеседника по голосу – в этом случае используются платформы биометрии. Отдельные каналы, например, мессенджеры или ассистент Алиса в мобильном телефоне, позволяют совмещать визуальные интерактивные элементы (например, кнопки или карточки товаров, на которые можно тапнуть) и естественный язык. Для работы с ними необходима интеграция с соответствующими API.

Запрос, преобразованный в текст, поступает в диалоговую платформу. Ее задача – понять смысл сказанного, уловить пользовательский интент и эффективно обработать его, отдав результат. Для этого диалоговые платформы используют множество технологий, таких как нормализация текста, морфологический анализ, анализ семантической близости сказанного, ранжирование гипотез, выделение именованных сущностей и, наконец, формирование запросов уже на машинном языке, через совокупность API к внешним базам данных и информационным системам. Примером таких внешних систем может быть 1С, Битрикс24, SAP, CRM системы, базы контента или сервисы, наподобие Deezer или Google Play Music. Получив данные, диалоговая платформа генерирует ответ – текст, голосовое сообщение (с помощью TTS), включает стриминг контента или уведомляет о совершенном действии (например, размещении заказа в электронном магазине). Если в первоначальном запросе данных для принятия решений по дальнейшему действию недостаточно, платформа NLU инициирует уточняющий диалог, чтобы получить все недостающие параметры и снять неопределенность.

Цифровой помощник: эволюция чат-бота с ИИ

Хотя текстовые чат-боты — это практическое решение многих проблем, у них есть одно ограничение. Они не могут обеспечить сочувствие и эмоциональную связь, которые мы получаем от личного разговора. Микровыражения, зрительный контакт, язык тела и одежда говорят в разговоре гораздо больше, чем мы думаем. Чтобы приступить к решению этой проблемы, NTT DATA Business Solutions разработала чат-бота в виде анимированного человека. Цифровые люди созданы, чтобы помочь нам чувствовать больше эмоций при общении с компьютером, чтобы мы могли найти нужную нам информацию с меньшим разочарованием, если это займет больше времени, чем ожидалось.

Цифровой аватар NTT DATA Business Solutions не только выглядит более естественным, но и использует распознавание лиц и автоматическое распознавание речи для идентификации людей и интерпретации их эмоций. Как и в наших собственных разговорах, он регулирует тон голоса и язык тела в соответствии с ситуацией. Он даже имеет возможность запоминать предыдущие разговоры с помощью программного обеспечения для распознавания речи, что устраняет утомительный процесс повторения информации в интерфейсе бота.

Разговорный ИИ улучшает качество обслуживания клиентов.

Вебинар по запросу: Как цифровые помощники меняют CRM

Наш эксперт Томас Нормарк (Thomas Nørmark), глобальный руководитель отдела искусственного интеллекта и робототехники, знакомит вас с миром разговорного искусственного интеллекта. Узнайте, как стать инновационным лидером, используя коммуникативные навыки цифровых помощников, и как повысить качество обслуживания клиентов.

Как Kia Motors улучшила обслуживание клиентов с помощью разговорного ИИ

Для Kia Motors компания NTT DATA Business Solutions разработала цифрового человека Kia Mia, который использовался в автосалонах, чтобы привлекать клиентов и отвечать на сложные вопросы. Когда количество клиентов, посещающих шоурум, превышает количество продавцов, Миа может начать процесс продаж и предоставить информацию быстрее, чем это может сделать человек.

Цифровой аватар помогает в домашнем обучении

Технологии искусственного интеллекта, такие как цифровые аватары, могут помочь детям и учителям в индивидуальном обучении. В нашем примере наш AI Learning Helper помогает детям стать уверенными читателями. Механизм обучения помогает ученикам с использованием словаря, произношением и пониманием прочитанного. Цифровой аватар может задавать вопросы и отвечать на них, а также выявлять эмоции.

Решение предлагает учителям дашбор, на котором отображается информация об учебных профилях и успеваемости их учеников.

Поддержите своих сотрудников с помощью новых интеллектуальных технологий, используя разговорный ИИ.

Распознавание голоса

Для измерения голоса программа использует ряд звуковых параметров: частоту и длину звуковой волны в определенный момент времени. К примеру, когда вы общаетесь с популярным голосовым помощником Alexa, ПО разбивает ваш голос на 25-миллисекундные слайды, а потом преобразует каждый из отрезков в цифровые сигнатуры. После этого сигнатурные блоки сравниваются с внутренним каталогом звуков программы, пока количество совпадений не будет достаточно высоким, чтобы ИИ «перевел» цифры в понятный ему буквенный запрос.

Понаблюдайте за экраном телефона во время использования Siri или Google Assistant, и вы увидите, что набор слов изменяется в процессе того, как вы произносите слова. Происходит это из-за того, что программное обеспечение с каждым следующим «шагом» тоже сравнивает полученный результат с внутренней базой данных и выстраивает слова в зависимости от совпадений. По словам Рохита Прасада, главного ученого подразделения Alexa, которое принадлежит Amazon, «языковая модель обучается многим миллиардам слов в форме текста». Порядок слов тоже играет немаловажную роль: это можно заметить и с помощью обычной поисковой системы Google, которая порой выдает разные данные по идентичным запросам, в которых переставлена местами всего лишь пара слов.

Описание программы искусственного интеллекта ЭЛИС:

Программа искусственного интеллекта ЭЛИС – Электронно Логически Интеллектуальная Система. Система искусственного интеллекта ЭЛИС представляет собой программу. Это программное обеспечение, способное разговаривать как человек на простом языке, управлять устройствами , а также обучаться. Данная система не является ассистентом, так как упор идёт на разработку человекоподобной системы, которая сможет обучаться как ребёнок и вести осознанный диалог.

С помощью данной программы можно общаться с компьютером, а также взаимодействовать с физическим миром. Программа также использует возможность подключения Ардуино, чтобы создавать системы умного дома, автоматики и т.д.

Система искусственного интеллекта ЭЛИС построена по модульному принципу. Система универсальна и её функционал наращивается с помощью модулей . Они могут быть различные, от простых, до сложных.

Программа искусственного интеллекта ЭЛИС самостоятельно ведет диалог с человеком.

Она может самостоятельно начать диалог, может делать это несколько раз, что уже отличает её от голосовых асистентов, которые работают по структуре вопрос – ответ. Программа искусственного интеллекта ЭЛИС самостоятельно принимает решение после того, что скажет человек, и если не знает, её можно обучить .

При поддержке диалога с пользователем система сама обучается. Она способна запоминать несколько ответов на один или множество вопросов и иметь несколько вопросов на один или множество ответов.

Программа искусственного интеллекта ЭЛИС полностью совместима с платформой Ардуино, поэтому можно управлять многими устройствами. Можно попросить у системы включить свет , а она спросит, где именно включить, но можно попросить включить свет сразу в определённом месте, тогда она не будет переспрашивать.

Программа искусственного интеллекта ЭЛИС также способна запускать сторонние приложения и т.д.

Будущее чат-ботов и искусственного интеллекта в разработке веб-приложений

Искусственный интеллект влияет на развитие многих технологических тенденций, в том числе текстовых чат-ботов и голосовых цифровых помощников. Всё в одном флаконе революционизирует то, как мы, клиенты, взаимодействуем с Интернетом. Теперь нам не нужно пролистывать груды результатов поиска, не использовать системы фильтрации, чат-боты делают эту работу за нас в плавном разговоре.

Помимо чат-ботов, ИИ может быть полезен для разработки веб-приложений многими другими способами, такими как улучшение SEO, персонализированные поисковые системы и многое другое. Все эти решения вместе с чат-ботами делают веб-приложения более общими, персонализированными и интеллектуальными.

Однако для эффективного внедрения ИИ и чат-ботов в веб-приложения веб-разработчикам необходимо научиться правильно использовать концепции ИИ. Поэтому при поиске компании, которая создаст ваше веб-приложение, вам необходимо учитывать высококвалифицированных специалистов в этой области.

Оцените статью
Fobosworld.ru
Добавить комментарий

Adblock
detector