14. Кодирование текстовой информации

Двоичный код каждого символа при кодировании текстовой информации в персональном компьютере занимает

В задачах данного типа используются следующие понятия: кодирование, код, кодовая таблица (таблица кодировки). В задачах могут быть использованы следующие таблицы кодировки ASCII, Unicode, ISO, DOS, MAC, КОИ-8.

Решение задач на кодирование текстовой информации.

Задача 1. Текст, состоящий из 142 символов, закодирован с помощью таблицы кодировок Unicode. Определите количество информации (в битах) содержащейся в тексте.

Решение. Воспользуемся формулой: I= K×i, где I- количество информации, K- количество символов в тексте, i – информационный вес одного символа.

В таблице кодировок Unicode, для хранения каждого символа используется 2 байта. В тесте 142 символа, следовательно, I= 142×2=284байта.

Переводим из одной единицы измерения в другую, так как 1байт=8бит, то 284байт×8бит= 2272 бит.

Ответ. Информационный объем текста 2272бит.

Задача2. Сообщение из 118 символов было записано в 8-битной кодировке Windows-1251, после вставки в текстовый редактор сообщение было перекодировано в 16-битный код Unicode. На какое количество информации увеличилось количество памяти, занимаемое сообщением?

Решение. В кодировке Windows-1251, для хранения одного символа используется 8 бит, вычислим количество информации в сообщение. I= K×i, следовательно I=118×1=118байт.

В кодировке Unicode, для хранения одного символа используется 16 бит, тогда количество информации в сообщение будет равно: I=118×2=236байт.

В задачи стоит вопрос, на какое количество информации увеличилось количество памяти, для этого необходимо найти разность полученных объемов. 236-118=118байт.

Ответ: на 118 байт увеличилось количество памяти занятое сообщением.

Задача3. Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16-битном коде Unicode, в 8-битную кодировку КОИ-8. При этом количество информации уменьшилось на 480бит. Какова длина сообщения в символах?

Решение. Обозначим количество символов в сообщении через х.

Составим уравнение: количество бит, которое было первоначально, минус количество бит после перекодировки равно 480 бит.

Ответ: сообщение содержит 60 символов.

Задача4. С помощью последовательности десятичных кодов 99 111 109 112 117 116 101 114 закодировано слово computer. Какая последовательность десятичных кодов будет соответствовать этому же слову, записанному прописными буквами?

Решение. Таблица кодировок сначала содержит прописные буквы в алфавитном порядке, а затем строчные. Так как разница между десятичным кодом строчной буквы латинского алфавита и десятичным кодом соответствующей прописной буквы равна 32, то десятичный код прописной буквы С равен 99-32=67.

Аналогичным образом находятся остальные десятичные коды. 111-32=79, 109-32=77, 112-32=80, 117-32=85, 116-32=84, 101-32=69, 114-32=82.

Последовательность десятичных кодов слова COMPUTER составляет 67 79 77 80 85 84 69 82.

Ответ. 67 79 77 80 85 84 69 82.

Задача5. Для кодирования букв А, Б, В, Г решили использовать двухразрядные последовательные числа (от 00 до 11 соответственно). Какая получиться последовательность, если таким способом закодировать последовательность символов ВАБВГАБГ и записать результат шестнадцатеричным кодом?

Решение. Для записи текстовой информации необязательно использовать стандартные 8-битные и 16-битные кодовые таблицы. Если количество различных символов в сообщении мало, можно использовать особые, короткие, коды для записи каждого символа. Последовательность нулей и единиц, которыми кодируются символы сообщения, называются кодовыми словами. Если вероятность появления каждого символа сообщения одинакова, то символы кодируют кодовыми словами одинаковой длины. Составим таблицу кодовых слов. Для этого выпишем кодовое слово для каждой буквы.

Закодируем данную последовательность ВАБВГАБГ символов, для этого выпишем коды букв в том же порядке, что и буквы исходного сообщения, согласно этой таблицы.

Используя правила перевода из двоичной системы счисления в шестнадцатеричную, сгруппируем получившиеся двоичные цифры по 4 и вместо каждой группы напишем соответствующую шестнадцатеричную цифру.

Ответ: 86С7.

Задача 6. Для 5 букв латинского алфавита заданы их двоичные коды для некоторых букв из двух бит, для некоторых из трех. Эти коды представлены в таблице:

Определите, какой набор букв закодирован двоичной строкой 0110100011000.

Решение. Так как код записывается начиная с младшего разряда, то необходимо разбить двоичную строку, начиная справа: 0110|100|011|000. При этом видно, что последние три буквы будут C, E, A. Кода 0110 нет, тогда его можно разбить код из двух бит: 01|10, следовательно, 01-В, 10-D. Итак, двоичной строкой 0110100011000 закодирован следующий набор букв BDCEA.

§ 14. Кодирование текстовой информации

Текстовая информация по своей природе дискретна, т. к. представляется последовательностью отдельных символов.

В памяти компьютера хранятся специальные кодовые таблицы, в которых для каждого символа указан его двоичный код. Все кодовые таблицы, используемые в любых компьютерах и любых операционных системах, подчиняются международным стандартам кодирования символов.

Основой для компьютерных стандартов кодирования символов послужил код ASCII, рассчитанный на передачу только английского текста. Расширения ASCII — кодировки, в которых первые 128 символов кодовой таблицы совпадают с кодировкой ASCII, а остальные (со 128-го по 255-й) используются для кодирования букв национального алфавита, символов национальной валюты и т. п.

В 1991 году был разработан новый стандарт кодирования символов, получивший название Unicode (Юникод), позволяющий использовать в текстах любые символы любых языков мира. Кодировки Unicode позволяют включать в один документ символы самых разных языков, но их использование ведёт к увеличению размеров текстовых файлов.

1. Какова основная идея представления текстовой информации в компьютере?

2. Что представляет собой кодировка ASCII? Сколько символов она включает? Какие это символы?

3. Как известно, кодовые таблицы каждому символу алфавита ставят в соответствие его двоичный код. Как, в таком случае, вы можете объяснить вид таблицы 3.8 «Кодировка ASCII»?

4. С помощью таблицы 3.8:

01101100 01100001 01110000 01110100 01101111 01110000

5. Что представляют собой расширения ASCII-кодировки? Назовите основные расширения ASCII-кодировки, содержащие русские буквы.

6. Сравните подходы к расположению русских букв в кодировках Windows-1251 и КОИ-8.

7. Представьте в кодировке Windows-1251 текст «Знание — сила!»:

8. Представьте в кодировке КОИ-8 текст «Дело в шляпе!»:

9. Что является содержимым файла, созданного в современном текстовом процессоре?

10. В кодировке Unicode на каждый символ отводится 2 байта. Определите в этой кодировке информационный объём следующей строки:

11. Набранный на компьютере текст содержит 2 страницы. На каждой странице 32 строки, в каждой строке 64 символа. Определите информационный объём текста в кодировке Unicode, в которой каждый символ кодируется 16 битами.

12. Текст на русском языке, первоначально записанный в 8-битовом коде Windows, был перекодирован в 16-битную кодировку Unicode. Известно, что этот текст был распечатан на 128 страницах, каждая из которых содержала 32 строки по 64 символа в каждой строке. Каков информационный объём этого текста?

13. В текстовом процессоре MS Word откройте таблицу символов (вкладка Вставка → Символ → Другие символы ):

1. Запустим программу Блокнот (NotePad). Программа Блокнот в операционной системе Windows ХР запускается с помощью команды: [Кнопка Пуск – Программы – Стандартные – Блокнот]. В открывшемся окне программы Блокнот напечатаем слово «Компьютер» с использованием синтаксиса языка разметки гипертекстовых документов – HTML (Hyper Text Markup Language). Этот язык используется для создания документов в Интернете. Текст должен выглядеть следующим образом:

Компыотер

, где

и

теги (специальные конструкции) языка HTML для разметки заголовков. На рис. 3.5 представлен результат этих действий.

Рис. 3.5. Отображение текста в окне Блокнот

Сохраним этот текст, выполнив команду: [Файл – Сохранить как…] в соответствующей папке компьютера, при сохранении текста файлу присвоим имя – Прим, с расширением файла. html.

2. Запустим программу Internet Explorer, выполнив команду: [Кнопка Пуск – Программы – Internet Explorer]. При запуске программы появится окно, представленное на рис. 3.6

Рис. 3.6. Окно доступа в автономный режим

Выберем и активизируем кнопку Автономно при этом не произойдет подключение компьютера к глобальной сети Интернет. Появится основное окно программы Microsoft Internet Explorer, представленное на рис. 3.7.

Рис. 3.7. Основное окно Microsoft Internet Explorer

Выполним следующую команду: [Файл – Открыть], появится окно (рис. 3.8), в котором необходимо указать имя файла и нажать кнопку ОК или нажать кнопку Обзор… и найти файл Прим.html.

Рис. 3.8. Окно «Открыть»

Основное окно программы Internet Explorer примет вид, показанный на рис. 3.9. В окне отобразится слово «Компьютер». Далее, используя верхнее меню программы Internet Explorer, выполним следующую команду: [Вид – Кодировка – Кириллица (DOS)]. После выполнения этой команды в окне программы Internet Ехplorer отобразятся символы, показанные на рис. 3.10. При выполнении команды: [Вид – Кодировка – Кириллица (KOI8-R) ] в окне программы Internet Explorer отобразятся символы, показанные на рис. 3.11.

Рис. 3.9. Символы, отображаемые при кодировке СР1251

Рис. 3.10. Символы, отображаемые при включении кодировки СР866 для кодовой последовательности, представляемой в кодировке СР1251

Рис. 3.11. Символы, отображаемые при включении кодировки КОИ8-Р для кодовой последовательности, представляемой в кодировке СР1251

Таким образом, полученные с помощью программы Internet Explorer последовательности символов совпадают с последовательностями символов, полученных с помощью кодовых таблиц СР866 и КОИ8-Р в примере 3.1.

Двоичный код каждого символа при кодировании текстовой информации в персональном компьютере занимает

Тесты по информатике 7 класс. Тема: «Двоичное кодирование»

Правильный вариант ответа отмечен знаком +

1. Двоичным будет кодирование, которое ставит в соответствие каждому тексту:

— его длину в символах, считая и пробелы, знаки препинания

+ гласной букве – 0, согласной — 1

— второй цифре нового слова – 1, остальным нули, кроме знаков препинания

2. У каждого двоичного кодирования имеется свойство:

— декодируемости (обратимости кодирования)

3. Не у каждого двоичного кодирования имеется свойство:

— применимости (кода к любому элементу кодируемого набора)

— представимости кода через 0 и 1

4. Преобразование информации из непрерывного вида представления в дискретную называется:

5. Конечный набор различных символов (знаков) для представления информации – это:

6. Количество знаков в алфавите – это его:

7. Алфавитом двоичного кодирования не будет алфавит их символов:

8. В двоичном алфавите представлен текст:

9. Количество символов двоичного кода называется его (двоичного кода):

тест 10. В двоичном коде можно закодировать:

— количество годовых колец на спиле дерева

+ количество всех документов в поисковом запросе Яндекса

11. Кодирование, которое дает всегда одинаковой разрядности код называется:

12. Дискретизацией информации называется процесс преобразования ее из:

— непрерывной формы в регистрируемую

— дискретной формы в непрерывную

+ непрерывной формы в конечную

13. Алфавитом называют набор любых:

14. Алфавитом может служить набор символов:

15. Алфавитом не может служить набор символов:

+ 0,1, 2, 10, 11, 12, 20, 21, 22

16. Минимальная разрядность двоичного кода для кодирования всех 10-буквенных слов русского языка равна:

17. Если в некотором алфавите все слова можно кодировать двоичным однородным кодом минимальной длины 6, то слов в алфавите не более:

18. Наименьшая длина двоичного кода для кодирования всех 16 слов некоторого алфавита равна:

19. Кодирование по правилу «Буква алфавита – Порядковый десятичный номер буквы в алфавите»:

— будет двоичным кодированием

+ не будет двоичным кодированием

— будет двоичным кодированием, если алфавит состоит лишь из 0 и 1

тест-20. Кодирование по правилу «Буква алфавита – Порядковый двоичный номер буквы в алфавите»:

+ будет двоичным кодированием

— не будет двоичным кодированием

— будет двоичным кодированием, если алфавит состоит лишь из 0 и 1

21. Двоичный код всегда использует таблицу кодирования типа:

— «символ алфавита – код ASCII»

— «символ алфавита – код UNICODE»

+ «символ алфавита – слово из двоичных знаков»

22. Двоичным кодом может быть набор:

23. Азбука Морзе является кодированием:

24. Десятичное число 16 имеет двоичный код:

25. Двоичный код 1001 соответствует десятичному числу:

26. В алфавите десятичных чисел при однородном кодировании не может быть кодового слова:

27. В алфавите десятичных чисел при однородном кодировании может быть кодовое слово:

28. Двоичное кодирование всегда ставит в соответствие кодируемому тексту:

— длину текста в двоичных единицах

+ текст из двоичных кодов символов алфавита

29. В двоичном алфавите закодирован текст:

тест_30. В двоичном представлении за конечное время невозможно записать:

+ множество всех натуральных чисел

31. Двоичным алфавитом является набор символов:

32. Минимальная разрядность двоичных кодов всех натуральных десятичных чисел от 1 до 64 равна:

33. Если в алфавите символов все слова закодировать двоичными однородными кодами длины 2, то кодом слова АББА будет:

34. Наименьшая длина двоичного кода для кодирования алфавита из прописных и заглавных букв кириллицы равна:

35. Кодирование по правилу «Сложение – 1, вычитание – 0»:

— будет двоичным кодированием для десятичной арифметики

+ не будет двоичным кодированием для десятичной арифметики

— будет двоичным кодированием для двоичной арифметики

36. Двоичными кодами может быть все перечисленное в наборе:

37. Азбука Морзе имеет мощность алфавита, равную:

38. Десятичное число 122 имеет двоичный код:

— 10… (120 нулей) …01

39. Двоичный код 11100 соответствует десятичному числу:

тест*40. В алфавите десятичных чисел при однородном кодировании не будет присутствовать кодовое слово:

41. В алфавите десятичных чисел при однородном кодировании может присутствовать кодовое слово:

42. К атрибутам сообщений для любых алфавитов относится:

— представление в двоичном коде

43. К атрибутам любых алфавитов не относится:

44. Любой компьютер обрабатывает, в конечном (внутреннем) представлении лишь:

Тест по информатике Кодирование текстовой информации 10 класс

Тест по информатике Кодирование текстовой информации 10 класс с ответами. Тест включает 5 заданий с выбором ответа.

1. Укажите фрагмент текста, имеющий максимальную сумму кодов символов (в таблице ASCII).

2. Используется кодовая таблица CP-1251 (Windows Cirillic). Сколько килобайт будет занимать файл в простом текстовом формате (plain text), если в тексте 200 страниц, на странице 32 строки, а в строке в среднем 48 символов?

1) 307,2
2) 300
3) 384
4) 2400

3. Сообщение на русском языке было первоначально записано в 16-битном коде Unicode. При его перекодировке в 8-битную кодировку КОИ-8 информационное сообщение уменьшилось на 960 бит. Какова длина сообщения в символах?

4. В таблице ниже представлена часть кодовой таблицы ASCII:

Символ 1 3 A T Z a z
Десятичный код 49 51 65 84 90 97 122
Восьмеричный код 61 63 101 124 132 141 172

Каков восьмеричный код символа «t»?

5. Одна кодировочная таблица содержит 2048 символов. Для кодирования символа с помощью второй таблицы требуется на 2 бита меньше, чем для кодирования символа с помощью первой таблицы. Определите, сколько символов включено во вторую кодировочную таблицу.

Ответы на тест по информатике Кодирование текстовой информации 10 класс
1. 2
2. 2
3. 120
4. 1648
5. 512

Двоичный код каждого символа в компьютерном тексте занимает 1 байт памяти.

Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки.

Для разных типов ЭВМ используются различные таблицы кодировки.

Международным стандартом для ПК стала таблица ASCII (Американский стандартный код для информационного обмена).

Кодировка ASCII(American Standard Code for Information Interchange)

Поряд-ковый № Код Символ
0-31 00000000-00011111 Управляющие символы. Их функция – управление процессом вывода текста на экран или печать, подача звукового сигнала, разметка текста и т.п.
32-127 00100000-01111111 Стандартная часть таблицы (английская). Сюда входят строчные и прописные буквы латинского алфавита, десятичные цифры, знаки препинания, всевозможные скобки, коммерческие и другие символы.
128-255 10000000-11111111 Альтернативная часть таблицы (русская). Вторая половина кодовой таблицы ASCII, называемая кодовой страницей , может иметь различные варианты, каждый вариант имеет свой номер. Кодовая страница в первую очередь используется для размещения национальных алфавитов, отличных от латинского. В русских национальных кодировках в этой части таблицы размещаются символы русского алфавита.

В настоящее время существуют пять различных кодировок кириллицы: КОИ8-Р, Windows, MS-DOS, Macintosh,ISO.

Из-за этого часто возникают проблемы с переносом русского текста с одного компьютера на другой, из одной программной системы в другую.

Это 16-разрядная кодировка, т.е. в ней на каждый символ отводится 2 байта памяти.

При этом объем занимаемой памяти увеличивается в 2 раза. Но зато такая кодовая таблица допускает включение до 65536 символов.

Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов.

В. 11. Кодирование звуковой информации.

n Каждый компьютер, имеющий звуковую плату, микрофон и колонки, может записывать, сохранять и воспроизводить звуковую информацию.

n С помощью специальных программных средств (редакторов звукозаписей) открываются возможности по созданию, редактированию и прослушиванию звуковых файлов.

n Создаются программы распознавания речи и, в результате, появляется возможность управления компьютером при
помощи голоса.

n Раздел физики, занимающийся изучением звуковых явлений, называется акустикой.

n Явления, связанные с возникновением и распространением звуковых волн, называются акустическими явлениями.

n Упругие волны в воздухе с частотой от 16 до 20000 Гц вызывают у человека звуковые ощущения. Волны с частотой меньше 16 Гц называют инфразвуковыми, а с частотой больше 20 000 Гц — ультразвуковыми.

n Скорость распространения звука зависит от упругих свойств среды, ее плотности и температуры. В нормальных условиях скорость звука равна 331 м/с. Скорость звука не зависит от частоты.

n По принятой классификации звук подразделяют на музыкальные звуки (тоны) и шумы.

n Звук представляет собой звуковую волну с непрерывно меняющейся амплитудой и частотой.

n Чем больше амплитуда сигнала, тем он громче для человека, чем больше частота сигнала,
тем выше тон.

n Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть превращен в последовательность электрических импульсов (двоичных нулей и единиц).

n Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина амплитуды.

n Аналоговый сигнал непрерывен по времени, а цифровой – это дискретный, импульсный, прерывистый сигнал.

n Непрерывная зависимость амплитуды сигнала от времени А(t) заменяется на дискретную последовательность уровней громкости. Каждой “ступеньке” присваивается значение уровня громкости звука, его код (1, 2, 3 и т.д.).

n Современные звуковые карты обеспечивают 16-битную глубину кодирование звука

n Качество двоичного кодирования звука определяется глубиной кодирования и частотой дискретизации.

n Глубина кодирования – количество бит, отводимых для кодирования уровня громкости (амплитуды) звукового сигнала.

n Частота дискретизации — количество измерений уровня сигнала в единицу времени.

n Звуковые редакторы позволяют записывать воспроизводить и редактировать звук.

n Оцифрованный звук представляется в звуковых редакторах в наглядной форме, поэтому операции копирования, перемещения и удаления частей звуковой дорожки можно легко осуществлять с помощью мыши. Можно накладывать звуковые дорожки друг на друга (микшировать звуки) и применять различные акустические эффекты (эхо, воспроизведение в обратном направлении и др.).

n Звуковые редакторы позволяют изменять качество цифрового звука и объем звукового файла путем изменения частоты дискретизации и глубины кодирования. Оцифрованный звук можно сохранять без сжатия в звуковых файлах в универсальном формате WAV или в формате со сжатием МР3, MIDI и др.

n При сохранении звука в форматах со сжатием (напр., MP3) отбрасываются «избыточные» для человеческого восприятия звуковые частоты с малой интенсивностью, совпадающие по времени со звуковыми частотами с большой интенсивностью.

n Применение такого формата позволяет сжимать звуковые файлы в десятки раз, однако приводит к необратимой потере информации (файлы не могут быть восстановлены в первоначальном виде).

n Файлы формата MIDI являются набором команд для «зашитых» в звуковую плату ПК синтезированных звуков. При воспроизведении данного формата можно изменять тональность, темп, подменять инструменты.

n MIDI имеет очень маленький объём и может воспроизводиться только при помощи специальных компьютерных программ MIDI-плееров. Формат MIDI не приемлем для записи и хранения голоса.

Поперечные профили набережных и береговой полосы: На городских территориях берегоукрепление проектируют с учетом технических и экономических требований, но особое значение придают эстетическим.

Общие условия выбора системы дренажа: Система дренажа выбирается в зависимости от характера защищаемого.

Папиллярные узоры пальцев рук — маркер спортивных способностей: дерматоглифические признаки формируются на 3-5 месяце беременности, не изменяются в течение жизни.

Механическое удерживание земляных масс: Механическое удерживание земляных масс на склоне обеспечивают контрфорсными сооружениями различных конструкций.

© cyberpedia.su 2017-2020 — Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

Оцените статью
Fobosworld.ru
Добавить комментарий

Adblock
detector