Он нас понимает? Как компьютер учит языки людей

Татьяна Ландо, Google — о том, как общаться с ИИ и нужен ли миру общий язык

С повсеместным распространением интернета, растущим количеством устройств с естественно-языковыми интерфейсами в мире становится всё более популярной компьютерная лингвистика. Специалисты этой профессии работают в компаниях Google, Яндекс, Mail.Ru и ABBYY. В 2019 году вопрос совершенствования ИИ был включен в национальную стратегию развития, а компьютерная лингвистика — в перечень профессий будущего. Татьяна Ландо, лингвист-аналитик компании Google, рассказала «Хайтеку» об особенностях этой профессии, связи человеческого и компьютерного языков, взаимодействии человека и ИИ, а также необходимости автоматизации деятельности человека.

Читайте «Хайтек» в

Татьяна Ландо — старший лингвист Google, живет и работает в Лондоне. Занимается проектами в компьютерной лингвистике и анализе языковых данных, проводит консультации по вопросам автоматической обработки естественного языка, выступает с лекциями про диалоговые системы. С 2012 по 2016 была одним из основных организаторов конференции AINL — Artificial Intelligence & Natural Language. В 2016 году стала соредактором первого учебника на русском языке «Прикладная и компьютерная лингвистика».

Машинный перевод

В 1950-х годах ученые обещали, что лет через пять потребность в людях-переводчиках полностью отпадет, потому что их заменят компьютеры.

Но до сих пор даже самые популярные онлайн-переводчики не могут конкурировать по качеству перевода с живыми специалистами. Зато они обыгрывают их в скорости и охвате – так, по статистике Google, приуроченной к десятилетию Google Translate, сервисом пользуется полмиллиарда человек. Кроме того, машинный перевод доступен бесплатно и поддерживает крупнейшие языки мира.

Что до качества перевода, то оно растет постепенно, но ощутимо. Вспомните легендарный переводчик PROMT и первые переводы от Google и Яндекс и сравните их с теми текстами, которые мы получаем сейчас.

Интересно, что последние десять лет ни переводчики, ни лингвисты не имеют к машинному переводу никакого отношения.

C-3PO – робот-переводчик из вселенной «Звездные войны» Источник

Борис Орехов рассказывает: «С пятидесятых годов прошлого века лингвисты создавали словари, расширяли грамматики, создавали алгоритмы перевода. Однако серьезных результатов удалось добиться только с помощью нейросетей. Им не требуются ни словари, ни грамматики – только живые данные, большие объемы текстов».

Нейронная сеть работает с массивами данных и улавливает в них закономерности. Например, она может анализировать последовательность букв и на ее основании выстраивать закономерности, переводить слова, которые не встречались в тренировочных данных, неологизмы.

Правда, иногда это приводит к забавным ситуациям.

Так, в 2017 году при переводе с английского на французский фразы «I am a flat earther» («Я сторонник теории плоской земли») получалось «Je suis fou» («Я сумасшедший»). Ошибку заметили и быстро убрали.

А вот на другую ошибку можно посмотреть и сейчас. Просто выберите в Google Translate перевод с монгольского на русский и напишите что-то вроде: «ааааааа оооооо уууууу». Результат вас удивит.

Google

Интернет-медиа Vice.com, заметив очередную ошибку такого рода (при переводе с сомалийского на английский сочетаний типа «ag ag» сервис выдавал цитаты из Библии), обратился в Google за разъяснениями. Представители компании ответили: «Google Translate учится на примерах переводов в интернете и так работает функция ввода бессмыслицы в систему: она генерирует новую бессмыслицу».

Проблемы

У машинного перевода сейчас две ключевые проблемы: это так называемые «грязные» данные и нехватка материалов.

Грязные данные возникают, когда нейросеть сопоставляет одинаковые по содержанию тексты, но не видит очевидных смысловых различий между ними: например, в тексте описаний товаров на английском все цены будут указаны в рублях, а на английском – в долларах. Поэтому нейросеть может запомнить эту параллель и переводить «рубль» как «dollar». Решение этой проблемы – дополнительное обучение нейросети и подсказки пользователей.

Что касается нехватки материалов, то эта проблема характерна для редких языков, имеющих мало письменных источников. Для перевода требуется два параллельных корпуса текстов, и если их недостаточно, то нейросеть не может обучиться. В этом случае помогает сопоставление близких языков.

Разработчик из команды машинного перевода «Яндекса» Антон Дворкович в своей статье поясняет: «Если понять, из чего состоит язык, и правильно определить нужные кусочки такого языкового конструктора, можно научиться переводить даже с вымышленных языков, в которых не так много описанных автором слов, но мы при этом можем предположить, как новые слова могли бы выглядеть. По этой же логике «Яндекс» научил свой переводчик работать с эльфийским языком».

Проблемы, связанные с мышцами и суставами

У людей, зарабатывающих на жизнь работой на компьютерах, наибольшее число жалоб на здоровье, связано с заболеваниями мышц и суставов. Неподвижная напряженная поза оператора, в течение длительного времени прикованного к экрану монитора, приводит к усталости и возникновению болей в позвоночнике, шее, плечевых суставах, а также развивается мышечная слабость и происходит изменение формы позвоночника.

Интенсивная работа с клавиатурой вызывает болевые ощущения в локтевых суставах, предплечьях, запястьях, в кистях и пальцах рук. Часто присутствуют жалобы на онемение шеи, боль в плечах и пояснице или покалывание в ногах. Но бывают, однако, и более серьезные заболевания. Наиболее распространен кистевой туннельный синдром, при котором нервы руки повреждаются вследствие частой и длительной работы на компьютере. В наиболее тяжелой форме этот синдром проявляется в виде мучительных болей, лишающих человека трудоспособности [1].

Особенности общения старшеклассника

Отличительная особенность детей подросткового и юношеского возраста это их тяга к общению со сверстниками и, как следствие этого, некоторая

социально-психологическая изолированность от взрослых, сопровождающаяся образованием не больших замкнутых групп друзей, живущих автономной, обособленной жизнью. Как можно эту естественную тягу подростков и юношей к межличностному одновозрастному общению употребить с максимальной пользой для их воспитания?

Для нахождения ответа на этот вопрос необходимо выяснить 3 вещи:

  • каковы потребности детей, побуждающие их к общению друг с другом именно в этом возрасте;
  • каковы воспитательные задачи, которые можно решить с помощью такого общения;
  • каковы возможности групп подростков и юношей в решении этих задач.

Замкнутые возрастные группировки, психологически изолированные от взрослых, подростки и юноши образуют потому что волнуют вопросы, которые ни с кем, кроме сверстников, они не могут обсудить открыто. У детей этого возраста имеется много специфических интересов, удовлетворить которые они не в состоянии только в непосредственном общении друг с другом, так как для взрослых их дела могут оказаться не интересными и не заслуживающими внимания.

Среди этих вопросов и интересов не мало таких, которые имеют большое значение для личностного развития детей данного возраста. Через общения организуемое со сверстниками, подростки и юноши усваивают жизненные цели и ценности, нравственные идеалы, нормы и формы поведения. Пробуя себя в контактах друг с другом, в совместных делах, в различных ролях, они усваивают ролевые формы поведения, формируют и развивают у себя деловые качества, обучаются руководить и подчиняться, быть организаторами дела и исполнителями.

Общение в этом возрасте является важнейшей школой самовоспитания, которому подростки и юноши уделяют большое внимание. Для того чтобы имеющиеся в общении возможности были максимально реализованы детьми, необходимо чтобы они как можно больше заимодействовали не только между собой, но и со взрослыми в самых разных делах и ситуациях. Желательно, чтобы такие естественно образующие группировки детей были на виду у взрослых, но не для того, чтобы вмешиваться в их дела, а стой целью, чтобы психологически и педагогически умело руководить ими, усиливая их положительное воспитательное влияние.

Влияние компьютера и компьютерной игры на язык общения школьников

Такие группы, в частности, можно использовать для организации школьного ученического самоуправления, для решения воспитательных задач. Взрослые, время от времени включающие в общение с детьми могут принести им ощутимую пользу. Ребенок этого возраста на самом деле очень нуждается в помощи взрослых, хотя сами могут этого осознавать, более того – не стремиться и не искать этой помощи. Дети часто не в состоянии найти правильные ответы на те вопросы, которые их волнуют и которые они между собой активно обсуждают. Доминанте юношеского типа общения соответствует появление нового типа диалога, специфичного для юношеского типа общения – исповедного.

Юношескому типу свойственны все остальные виды диалога – информационный, дискуссионный. Для юношеского общения типичны состояния ожидания, поиска в наличии дружеского общения со сверстниками своего и противоположного полов. В старших классах дружеское общение становится типичным. Лишь 13 % юношей и 24 % девушек, заполняя опросный лист, указывают, что у них нет близких друзей своего пола. Друзья противоположного пола есть у 43 % юношей и 58 % девушек.

Старшеклассники одновременно могут входить в несколько групп: небольшую приятельскую (5-6 человек), большую компанию (12-15 человек). Для общения в этих группах характерно то, что предмет их занятий выступает лишь как повод, фон общения. Содержание общения этих групп не совпадает.

Содержание общения старшеклассников совершенно явно связано с той жизнедеятельностью, в которую включены юноши и девушки в воспитательных коллективах. От содержания, интенсивности и привлекательности и форм ее организации зависит объем и интенсивность общения старшеклассников.

Профессионализмы

Изучая ПК-лексику, стоит обратить внимание на профессионализмы, связывая с такой специальностью, как «компьютерщик». Это слово используется для названия нескольких десятков профессий, связанных с работой ЭВМ. В зависимости от специализации, будут отличаться и компьютерные профессионализмы, употребляемые в ее среде.

язык интернета компьютерный жаргон и сленг игромано

К примеру, специфический жаргон программистов не всегда будет понятен технарям, а уж рядовым «юзерам» (пользователям, которыми является мы с вами) он и вовсе покажется тарабарщиной. Понять ее можно будет только «погуглив» («поискать в интернете» — пример сленга).

Однако, поскольку практически каждый обладатель ПК (знающий, что «камень» — это процессор, а «винт» — жесткий диск) привык считать себя «компьютерщиком», именовать всю специфическую лексику этой среды «профессионализмами» не очень корректно. Это то же самое, что ставить в один ряд стоматолога, умеющего ставить коронки, и хирурга, специализирующегося на коронарном шунтировании.

Тем более, что как таковой профессии «компьютерщик» нет. Есть программисты, специалисты по монтажу различных видов ЭВМ и сопутствующего оборудования, вебразработчики, верстальщики и т. п. Помимо людей, трудящихся над усовершенствованием компьютеров и программ к ним, есть юзеры, которые работают с ПК (дизайнеры, геймеры) или просто пользуются ей, не в качестве профессионального инструмента.

Все перечисленные категории используют в своей речи компьютерный жаргон. Но поскольку не все они специалисты, то будет более правильно классифицировать эту группу терминов как сленг, а не называть такие слова «профессионализмы».

Так именовать корректнее специфическую лексику отдельных специальностей, связанных с работой ЭВМ. Например, профессионализмы программистов, технарей, верстальщиков и т. п.

Аннотация к презентации

Посмотреть и скачать презентацию по теме «Человек и компьютер» по информатике, включающую в себя 11 слайдов. Скачать файл презентации 0.32 Мб. Средняя оценка: 2.0 балла из 5. Для учеников 5-8 класса. Большой выбор учебных powerpoint презентаций по информатике

Презентация: Человек и компьютер

ЧЕЛОВЕК И КОМПЬЮТЕР

Слайд 2

Как все начиналось

На протяжении всей истории развития цивилизации человек постоянно изобретал приспособления, помогающие ему в работе и в быту. Он всегда стремился извлечь пользу из окружающей природы. Чтобы добыть пищу, охотился и собирал растения. Затем научился обрабатывать землю, строить жилье. Усложнялась деятельность человека, совершенствовались и орудия труда. Так появились механизмы для поднятия тяжестей, и ткацкие станки, и средства передвижения, и бытовые приборы и множество других устройств, которые окружают нас. То, что сначала было плотом фантазии, постепенно становилось реальностью.

Слайд 3

Самым замечательным изобретением XX-го века стал компьютер. Вы можете увидеть его в школе, в магазине, в аэропорту, в телевизионной студии и т.д. Пользователем компьютера может быть и писатель, и художник, и врач, и музыкант, и инженер… И вы в своей будущей профессии скорее всего тоже будете его использовать. Это универсальный инструмент, который способен помочь каждому. А что такое компьютер? Зачем он нужен?

Слайд 4

Человек и информация

Человек обладает уникальной способностью – работать с информацией. Он может получать информациюиз окружающего мира в виде звуков, зрительных образов, запахов.

Слайд 5

Он может передавать информациюголосом, жестами, в виде записи и рисунков.

Слайд 6

Всем известны способы хранения информациине только в памяти, но и в блокнотах, книгах, на аудио- и видеокассетах и других носителях.

Слайд 7

Очень ценной является способность обрабатывать информацию – осмысливать ее и делать выводы.

Слайд 8

Компьютер и информация

Создавая компьютер, человек снабдил его устройствами, способными работать с информацией.

Слайд 9

Устройства компьютера

Перед собой на столе вы видите устройства, из которых состоит компьютер. Это системный блок, монитор, клавиатура, мышь.

Слайд 10

Устройства ввода информации

Информация поступает от человека в компьютер через устройства ввода: это клавиатура и мышь.

Слайд 11

Устройства вывода информации

Увидеть результат работы можно на экране монитора или вывести его на бумагу с помощью принтера. Это устройства вывода информации.

Есть ли выход?

Как уже говорилось, у человека есть свой программный код – это его ДНК. Состоит он из трёх миллиардов нуклеотидов. Каждый человек индивидуальность, соответственно, код каждого человека чем-то отличается от миллионов других. Однако среди всех существующих на нашей планете элементов, программный код человека самый сложный.

Первой задачей человека является понять, каковы особенности работы операционной системы, которая породила его и его мир. А второй задачей – прийти к пониманию своего собственного программного кода. Скептики, естественно, укажут на то, что это просто невозможно, т.к. программа не способна осознать того, что она программа, т.е. она не может породить внутри себя самой какую-либо функцию, заранее не запрограммированную Творцом. Но с этим можно поспорить.

Ничто и никогда нельзя держать под постоянным контролем. Механизмы всегда будут давать сбои, программы всегда будут «лагать» и «глючить», вырываясь из-под неустанного бдения тех, кто их создал. Исходя из этого, человек, понявший суть операционной системы и вселенской программы, может найти выход из замкнутого круга закономерного движения мегабайтов и пикселей жизни. Наша задача – отыскать ту диковинную кнопку, нажав которую можно отключить контроль над надлежащим выполнением программой своих функций. Такой кнопкой может стать, изменение ДНК в режиме «онлайн». Звучит, конечно, фантастически, но и сама теория, как вы уже, наверное, заметили, не лишена доли фантастики. Хотя, кто знает, быть может, материалисты и идеалисты на протяжении веков спорили не о том?

Ну, а для того чтобы привнести в вашу жизнь ещё немного фантастики и заодно дать пищу для размышлений, мы рекомендуем вам посмотреть несколько интересных фильмов: «Матрицу» и «Начало» вы, естественно, видели, поэтому советуем вам посмотреть «Тринадцатый этаж», «Меняющие реальность», «Тёмный город», «Остров» и «Метропию». Быть может, концепция о том, что человек и мир – это компьютерные программы уже не будет казаться вам такой нереальной…

Оцените статью
Fobosworld.ru
Добавить комментарий

Adblock
detector