Урок 13Представление текстов в памяти компьютера. Кодировочные таблицы

Учитель информатики

Информатика. 5 класса. Босова Л.Л. Оглавление

Ключевые слова:

  • текст
  • текстовый документ
  • текстовый редактор
  • правила ввода текста
  • редактирование
  • форматирование

Как представляются тексты в памяти компьютера

А теперь «заглянем» в память компьютера и разберемся, как же представлена в нем текстовая информация.

Текстовая информация состоит из символов: букв, цифр, знаков препинания, скобок и др. Мы уже говорили, что множество всех символов, с помощью которых записывается текст, называется алфавитом, а число символов в алфавите — его мощностью.

Широко распространенным способом представления текстовой информации в компьютере является использование алфавита мощностью 256 символов. Один символ такого алфавита несет 8 битов информации: 2 8 = 256. 8 битов = 1 байт, следовательно (см. § 6):

Двоичный код каждого символа занимает 1 байт памяти компьютера.

Теперь возникает вопрос, какой именно восьмиразрядный двоичный код поставить в соответствие тому или иному символу. (Понятно, что это дело условное, можно придумать множество способов кодирования.)

Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код — порядковый номер символа в двоичной системе счисления.

Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки.

На ЭВМ первых поколений для разных типов машин использовались различные таблицы кодировки. С распространением персональных компьютеров типа IBM PC международным стандартом стала таблица кодировки под названием ASCII (American Standart Code for Information Interchange — американский стандартный код для обмена информацией). Точнее говоря, стандартной в этой таблице является только первая половина, т. е. символы с номерами от нуля (двоичный код 00000000) до 127(01111111). Сюда входят буквы латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы. Остальные 128 кодов, ОТ 10000000 до 11111111, составляют так называемую кодовую страницу. Например, кодовая страница номер 1251 (СР1251) содержит русский алфавит и используется в операционной системе Windows и ее приложениях. Таблицу кодировки, используемую в Windows, называют ANSI (American National Standart Institute -^Американский национальный институт стандартов). Первые половины таблиц ASCII и ANSI полностью совпадают.

В таблице 3.1 приведена стандартная часть кода ANSI (коды от 0 до 31 имеют особое назначение, не отражаются какими-либо знаками и в данную таблицу не включены). Здесь приведены десятичные номера символов, символы, двоичные коды.

Обратите внимание на то, что в этой таблице латинские буквы (прописные и строчные) располагаются в алфавитном порядке. Расположение цифр также упорядочено по возрастанию значений. Это правило соблюдается и в других таблицах кодировки и называется принципом последовательного кодирования алфавитов. Благодаря этому понятие «алфавитный порядок» сохраняется и в машинном представлении символьной информации. Для русского алфавита принцип последовательного кодирования соблюдается не всегда.

Запишем, например, внутреннее представление слова «file». В памяти компьютера оно займет 4 байта со следующим содержанием:

01100110 01101001 01101100 01100101.

А теперь попробуйте решить обратную задачу. Какое слово записано следующим двоичным кодом:

01100100 01101001 01110011 01101011?

В таблице 3.2 приведена кодовая страница СР1251. Видно, что в ней для букв русского алфавита соблюдается принцип последовательного кодирования. Однако это правило действует не во всех существующих кодовых страницах с русским алфавитом.

Помимо восьмиразрядной кодировки символов все большее распространение получает шестнадцатиразрядная — двухбайтовая кодировка. Международный стандарт такой кодировки носит название UNICODE.

Тексты вводятся в память компьютера с помощью клавиатуры. На клавишах написаны привычные нам буквы, цифры, знаки препинания и другие символы. В оперативную память они попадают в форме двоичного кода.

Из памяти компьютера текст может быть выведен на экран или на печать в символьной форме. Но для долговременного хранения его следует записать на внешний носитель в виде файла.


Компьютер умеет оперировать символами следовательно он понимает тексты которые читает или переводит

§ 17. Системы перевода и распознавания текстов

Основные темы параграфа:

• как работают программы-переводчики;
• распознавание текста;
• ввод в компьютер печатного и рукописного текста.

В современном мире происходит очень важный процесс — формирование единого информационного пространства. Стираются информационные границы между странами и народами, у человека появляется возможность общаться в буквальном смысле слова со всем миром. Все это приводит к тому, что многие люди различных профессий начинают общаться с иностранными коллегами, читать справочную и другую специальную литературу на иностранном языке. Но далеко не каждый человек свободно владеет иностранными языками.

Современные компьютеры способны хранить большие массивы данных и производить в них быстрый поиск. Эти возможности компьютера можно использовать для создания электронных словарей и организации с их помощью перевода текста с одного языка на другой. Для этих целей сегодня уже существует множество программ.

Как работают программы-переводчики

Чтобы найти перевод неизвестного иностранного слова, пользователю электронного словаря достаточно ввести это слово в строке поиска, и уже через несколько мгновений будет получен исчерпывающий перевод. Современные текстовые процессоры имеют в своем составе словари, позволяющие производить орфографическую проверку правильности написания слов (на разных языках).

Но перевод отдельного слова и перевод целого текста — задачи совершенно разные. Чтобы понять смысл текста, не всегда хватает понимания значений всех входящих в него слов. Например, в английском языке слово «unit» имеет как минимум 6 различных значений. Какое из них имел в виду автор конкретного текста? Следствием необходимости решения этих проблем стало появление компьютерных систем перевода текстов. Современные системы перевода позволяют не только переводить, но и редактировать перевод, работать с различными тематическими словарями, выполнять как простой и быстрый, так и сложный и профессиональный перевод. Эти программы (вернее, пакеты программ) позволяют работать с файлами различных типов, электронной почтой, гипертекстовыми документами и т. п. К сожалению, задача адекватного перевода до конца еще не решена — многие программы зачастую выполняют ее не всегда удачно.

Рассмотрим простой пример. Переведем с помощью системы перевода на английский язык фразу:

Информатика — это наука об информации.

The computer science is an information science.

А теперь с помощью той же программы переведем эту фразу на русский язык. Получим:

Информатика — информатика.

Как говорится, почувствуйте разницу!

Системы перевода еще уступают человеку, особенно в работе с художественными текстами, но эта область информатики развивается очень быстро и «электронные карманные переводчики» уже становятся незаменимым помощником туриста, отправляющегося в страну с незнакомым для него языком.

Распознавание текста

Перед обсуждением этой темы давайте вспомним, какие устройства ввода информации существуют у современных компьютеров? Клавиатура, мышь, сканер и др. Сканер, например, позволяет вводить графическую информацию с листа бумаги.

За сотни лет человечество накопило огромный объем информации на традиционных бумажных носителях (книгах, газетах, журналах и т. п.). В настоящее время существует потребность (у электронных библиотек, к примеру) переносить эту информацию в память компьютера. Конечно, это можно сделать с помощью клавиатуры и текстового редактора, но, представьте себе, сколько времени уйдет даже у профессионального оператора на ввод, скажем, романа «Война и мир»? Необходимо как-то ускорить этот процесс. Встает вопрос, нельзя ли использовать сканер для ввода текстовой информации? Правда, в этом случае возникает такая проблема: все, что введено с помощью сканера, хранится в памяти ЭВМ как изображение. Надо «объяснить» компьютеру, что значок «с» — не просто закорючка, а буква, и хранить и обрабатывать его нужно как букву.

Ввод в компьютер печатного и рукописного текста

Существуют программы, позволяющие вводить тексты в ПК с помощью сканера. Используя специальные алгоритмы, они распознают буквы, позволяют редактировать распознанный текст и сохранять его в различных форматах. Популярной программой такого типа является АВВY FineReader. Работать с этой программой несложно. Сначала нужно отсканировать текст (управлять сканером можно прямо в среде (FineReader), затем разбить этот текст на фрагменты, потом распознать эти фрагменты, отредактировать полученный текст и, наконец, сохранить его в нужном текстовом формате. Интерфейс программы позволяет освоить эти операции легко и быстро.

Задача распознавания текста относится к области проблем, которые решает наука под названием «Искусственный интеллект». Современные распознающие программы умеют читать не только печатный текст, но и текст, написанный самым «корявым» почерком.

Коротко о главном

Современные программные средства позволяют переводить тексты с одного языка на другой и распознавать их, переводя из отсканированного графического представления в текстовые файлы.

Вопросы и задания

1. Что такое электронные словари?
2. Какие дополнительные проблемы возникают при переводе текстов? Что отличает систему перевода текста от электронного словаря?
3. Почему отсканированный текст нельзя сразу обрабатывать текстовым редактором?
4. В чем состоит проблема распознавания текста?

Чему вы должны научиться, изучив главу 3

• Набирать текст в одном из текстовых редакторов.
• Выполнять основные операции над текстом, допускаемые этим редактором.
• Сохранять текст на диске, загружать его с диска, выводить на печать.

И. Семакин, Л. Залогова, С. Русаков, Л. Шестакова, Информатика, 8 класс
Отослано читателями из интернет-сайтов

Планы уроков информатики, скачать тесты бесплатно, всё для учителя и школьника в подготовке к уроку по информатике 8 класс, домашние задания, вопросы и ответы

Если у вас есть исправления или предложения к данному уроку, напишите нам.

Если вы хотите увидеть другие корректировки и пожелания к урокам, смотрите здесь — Образовательный форум.

Моя твоя понимать: 5 устройств и технологий, которые уничтожают языковой барьер

Получайте на почту один раз в сутки одну самую читаемую статью. Присоединяйтесь к нам в Facebook и ВКонтакте.

Самые необычные устройство для перевода текстов и речи

Это раньше языковой барьер был существенной проблемой при общении людей, которые говорят на разных языках. Но сейчас появляется все больше устройств, которые позволят даже папуасу и японцу разговаривать друг с другом без переводчика. Мы собрали 5 самых интересных технологий , которые уничтожают языковой барьер .

Skype Translator – программа для онлайн-перевода текста и слов

Корпорация Microsoft, которой принадлежит программа Skype, как никто другой заинтересована в уничтожении языкового барьера между людьми из разных стран. И, кажется, ее специалисты нашли универсальный способ борьбы с незнанием пользователями языков друг друга. Имя ему – Skype Translator.

Skype Translator – программа для онлайн-перевода текста и слов

Skype Translator – это технология, которая в синхронном режиме переводит текст общающихся посредством Skype людей. Происходит это куда быстрее, чем при использовании живого переводчика-профессионала.

На данный момент, программа Skype Translator работает в тестовом режиме. В голосовом варианте она переводит с английского на испанский и наоборот, а в текстовом в ней доступно сорок самых распространенных в мире языков.

Skype Translator – программа для онлайн-перевода текста и слов

Skype Translator работает по принципу самообучения. Технология анализирует речь и тексты на разных языках, систематизирует данные и на их основе постоянно вносит в саму себя изменения. Программа даже умеет избавляться от слов-паразитов и исправлять неграмотность участников диалога. И это лишь тестовая версия!

SpeechTrans – умный браслет с функцией переводчика

Устройство с названием SpeechTrans не отличалось бы от множества других современных «умных» браслетов, если бы не особая функция, которая реализована в нем. Речь идет о программе SpeechTrans Ultimate Assistant, которая позволяет в онлайн-режиме переводить тексты и сказанные голосом слова.

SpeechTrans – умный браслет с функцией переводчика

Браслет SpeechTrans имеет базу из сорока четырех языков, с которыми он работает. Пользователь может ввести текст, который он хочет перевести, вручную, надиктовать его голосом либо дать произнести человеку из другой страны, с которым у него случилось недопонимание на почве языкового барьера.

Устройство SpeechTrans идеально подойдет для людей, которые много путешествуют по миру, в том числе, в страны, где говорят на незнакомых языках.

Помимо этого, браслет SpeechTrans может отображать информацию о поступивших на телефон звонках, текстовых сообщениях и электронных письмах, а также позволит управлять некоторыми функциями смартфона.

Bow-Lingual Dog Translation – устройство для общения с собаками

Куда сложнее у нас обстоит процесс общения с животными, чем с людьми других национальностей и культур. И если сами собаки и кошки часто понимают наши слова и эмоции, то причины их лая и мяуканья в подавляющем большинстве случаев остаются для нас неразрешимыми загадками.

Но устройство с названием Bow-Lingual Dog Translation позволит нам наконец-то полноценно общаться с нашими домашними любимцами. Пока что только с собаками. Ведь речь идет об электронном переводчике с собачьего на человеческий. Девайс умеет интерпретировать лай и другие звуки, которые издает пес.

Bow-Lingual Dog Translation – устройство для общения с собаками

Так что с Bow-Lingual Dog Translation владельцы собак смогут знать, когда их животное хочет есть, просится на улицу, тревожится или просто лает от удовольствия находиться рядом с человеком.

Dixau DX-5 – онлайн-переводчик печатного текста

В Интернете можно найти огромное количество интерактивных сервисов, способных достаточно точно переводить слова и предложения с одного языка на другой. Но речь в данном случае идет об электронном тексте, а когда дело касается печатных источников, эти сервисы становятся бессильны.

Dixau DX-5 – онлайн-переводчик печатного текста

Но несколько лет назад появилось устройство с названием Dixau DX-5 , которое позволяет переводить любой напечатанный текст со страниц книг, газет или журналов. Для этого в девайсе есть специальный сканер, который считывает слова и предложения, процессор распознает эту информацию, интерпретирует ее, переводит и выдает на экране Dixau DX-5. Девайс также может воспроизводить мелодии, считывая ноты.

Dixau DX-5 – онлайн-переводчик печатного текста

Dixau DX-5 обладает также модулем памяти, который позволяет сохранять переведенный текст в цифровом виде и переносить его на компьютер или мобильный телефон.

LaLaLa – наушники для синхронного перевода текста

Внешне устройство с названием LaLaLa больше напоминает слуховой аппарат, чем девайс, позволяющий разрушить языковой барьер между людьми, которые друг друга не понимают.

LaLaLa – наушники для синхронного перевода текста

LaLaLa – необходимо вставить в ухо, зацепив его за ушную раковину, что роднит его также с bluetooth-гарнитурами для мобильных телефонов. В принципе, таковой это устройство и является. Оно также может соединяться со смартфоном посредством беспроводных интерфейсов связи, однако основная цель этой интеграции – получить доступ к онлайн-базе данных языков.

Устройство LaLaLa при помощи встроенного микрофона улавливает речь людей и отправляет ее в цифровом виде на смартфон. Там этот текст в автоматическом режиме расшифровывается и переводится. В итоге человек всего через пару секунд получает уже переведенные фразы в наушник LaLaLa.

LaLaLa – наушники для синхронного перевода текста

LaLaLa позволяет полностью разрушить языковой барьер между представителями разных народов, если, конечно, они оба используют подобные устройства.

Практическая часть урока

image

Выполнить задание 6 к § 4.5 и ответить на вопросы контрольного модуля «Программы-переводчики».

image

Задание 1. Перевод текста — 1

1. Зайдите на сайт бесплатной интерактивной службы переводов Google (translate.google.ru) или воспользуйтесь другим онлайн-переводчиком.

2. Выполните компьютерный перевод текста из файла London Underground.rtf:

3. Сохраните результат перевода в личной папке в файле Лондонское метро.

image

Задание 2. Перевод текса — 2

1. Зайдите на сайт бесплатной интерактивной службы переводов Google (translate.google.ru) или воспользуйтесь другим онлайн-переводчиком.

2. Выполните компьютерный перевод текста из файла Sydney.rtf:

3. Оцените следующие высказывания, указав соответствующий знак (F– неправильно; T – правильно; NS – в тексте от этом не говорится) в рамочке рядом с каждым из них:

4. Сохраните результат работы в личной папке в файле Сидней.

image

Задание 3. Загадки

2. Переведите каждую загадку на русский язык и попробуйте отгадать её.

3. Запишите отгадки на английском языке.

4. Сохраните результат работы в личной папке в файле Отгадки.

image

Задание 4. Пословицы

2. Выполнитt компьютерный перевод каждой из пословиц с английского языка на русский язык и сохраните его в соответствующей ячейке таблицы.

3. Запишите аналог английской пословицы на русском языке.

4. Сохраните результат работы в личной папке в файле Пословицы.

image

Теперь вы умеете:

Оцените статью
Fobosworld.ru
Добавить комментарий

Adblock
detector