Учитель информатики
Информатика. 7 класса. Босова Л.Л. Оглавление
- знак
- знаковая система
- естественные языки
- формальные языки
- формы представления информации
Информация и физика
В физике есть понятие «энтропия системы», которое является мерой хаоса, беспорядка для термодинамической системы, информация же (антиэнтропия) – это мера ее сложности и упорядоченности. Если увеличивается ее сложность, то величина энтропии становится меньше, а величина информации растет. Подобный процесс, при котором увеличивается информация, возникает в открытых, саморазвивающихся, обменивающихся энергией и веществом с окружающей средой системах живой природы (белковые организмы и молекулы, популяции животных). Можно сказать, что в физике информацию рассматривают как антиэнтропию.
Графическая информация
Из курса информатики 7-9 классов вы знакомы с общими принципами компьютерной графики, с графическими технологиями. Здесь мы немного подробнее, чем это делалось раньше, рассмотрим способы представления графических изображений в памяти компьютера.
Принцип дискретности компьютерных данных справедлив и для графики. Здесь можно говорить о дискретном представлении изображения
Дискретное представление изображения. Изображение на экране монитора дискретно. Оно составляется из отдельных точек, которые называются пикселями (picture elements — элементы рисунка). Это связано с техническими особенностями устройства экрана, независимо от его физической реализации, будь то монитор на электронно-лучевой трубке, жидкокристаллический или плазменный. Эти «точки» столь близки друг другу, что глаз не различает промежутков между ними, поэтому изображение воспринимается как непрерывное, сплошное. Если выводимое из компьютера изображение формируется на бумаге (принтером или плоттером), то линии на нем также выглядят непрерывными. Однако в основе всё равно лежит печать близких друг к другу точек.
В зависимости от того, на какое графическое разрешение экрана настроена операционная система компьютера, на нем могут размещаться изображения, имеющие размер 800 х 600, 1024 х 768 и более пикселей. Такая прямоугольная матрица пикселей на экране компьютера называется растром.
Качество изображения зависит не только от размера растра, но и от размера экрана монитора, который обычно характеризуется длиной диагонали. Существует параметр разрешения экрана. Этот параметр измеряется в точках на дюйм (по-английски dots per inch — dpi). У монитора с диагональю 15 дюймов размер изображения на экране составляет примерно 28 х 21 см 2 . Зная, что в одном дюйме 25,4 мм, можно рассчитать, что при работе монитора в режиме 800 х 600 пикселей разрешение экранного изображения равно 72 dpi.
При печати на бумаге разрешение должно быть намного выше. Полиграфическая печать полноцветного изображения требует разрешения 200-300 dpi. Стандартный фотоснимок размером 10 х 15 см 2 должен содержать примерно 1000 х 1500 пикселей.
Дискретное представление цвета. Восстановим ваши знания о кодировании цвета, полученные из курса информатики основной школы. Основное правило звучит так: любой цвет точки на экране компьютера получается путем смешивания трех базовых цветов: красного, зеленого, синего. Этот принцип называется цветовой моделью RGB (Red, Green, Blue).
Двоичный код цвета определяет, в каком соотношении находятся интенсивности трех базовых цветов. Если все они смешиваются в одинаковых долях, то в итоге получается белый цвет. Если все три компоненты «выключены», то цвет пикселя — черный. Все остальные цвета лежат между белым и черным.
Дискретность цвета состоит в том, что интенсивности базовых цветов могут принимать конечное число дискретных значений.
Пусть, например, размер кода цвета пикселя равен 8 битам — 1 байту. Между базовыми цветами они могут быть распределены так:
2 бита — под красный цвет, 3 бита — под зеленый и 3 бита — под синий.
Интенсивность красного цвета может принимать 2 2 = 4 значения, интенсивности зеленого и синего цветов — по 2 3 = 8 значений. Полное число цветов, которые кодируются 8-разрядными кодами, равно: 4 • 8 • 8 = 256 = 2 8 . Снова работает главная формула информатики.
Из описанного правила, в частности, следует:
Обобщение этих частных примеров приводит к следующему правилу. Если размер кода цвета равен b битов, то количество цветов (размер палитры) вычисляется по формуле:
Величину b в компьютерной графике называют битовой глубиной цвета.
Еще один пример. Битовая глубина цвета равна 24. Размер палитры будет равен:
К = 2 24 = 16 777216.
В компьютерной графике используются разные цветовые модели для изображения на экране, получаемого путем излучения света, и изображения на бумаге, формируемого с помощью отражения света. Первую модель мы уже рассмотрели — это модель RGB. Вторая модель носит название CMYK.
Цвет, который мы видим на листе бумаги, — это отражение белого (солнечного) света. Нанесенная на бумагу краска поглощает часть палитры, составляющей белый цвет, а другую часть отражает. Таким образом, нужный цвет на бумаге получают путем «вычитания» из белого света «ненужных красок». Поэтому в цветной полиграфии действует не правило сложения цветов (как на экране компьютера), а правило вычитания. Мы не будем углубляться в механизм такого способа цветообразования. Расшифруем лишь аббревиатуру CMYK: Cyan — голубой, Magenta — пурпурный, Yellow — желтый, ЫасК — черный.
Тема 2.
Представление информации
Изучив эту тему, вы узнаете:
— что является основой представления информации;
— какие бывают формы представления информации;
— что такое код и кодирование информации;
— какие единицы измерения используются для определения объема информации;
— как кодируется в компьютере текстовая, числовая, графическая и звуковая информация.
2.1. Форма и язык представления информации
Воспринимая информацию с помощью органов чувств, человек стремится зафиксировать ее так, чтобы она стала понятной и другим, представляя ее в той или иной форме.
Музыкальную тему композитор может наиграть на пианино, а затем записать с помощью нот. Образы, навеянные все той же мелодией, поэт может воплотить в виде стихотворения, хореограф выразить танцем, а художник — в картине.
Человек выражает свои мысли в виде предложений, составленных из слов. Слова, в свою очередь, состоят из букв. Это — алфавитное представление информации.
Форма представления одной и той же информации может быть различной. Это зависит от цели, которую вы перед собой поставили. С подобными операциями вы сталкиваетесь на уроках математики и физики, когда представляете решение в разной форме. Например, решение задачи: «Найти значение математического выражения у = 5х + 3, при х = -3; -2; -1; 0; 1; 2; 3» можно представить в табличной или графической форме. Для этого вы пользуетесь визуальными средствами представления информации: числами, таблицей, рисунком.
Таким образом, информацию можно представить в различной форме:
◊ знаковой письменной, состоящей из различных знаков, среди которых принято выделять:
♦ символьную в виде текста, чисел, специальных символов (например, текст учебника);
♦ графическую (например, географическая карта);
♦ табличную (например, таблица записи хода физического эксперимента);
◊ в виде жестов или сигналов (например, сигналы регулировщика дорожного движения);
◊ устной словесной (например, разговор).
Форма представления информации очень важна при ее передаче: если человек плохо слышит, то передавать ему информацию в звуковой форме нельзя; если у собаки слабо развито обоняние, то она не может работать в розыскной службе. В разные времена люди передавали информацию в различной форме с помощью: речи, дыма, барабанного боя, звона колоколов, письма, телеграфа, радио, телефона, факса. Независимо от формы представления и способа передачи информации, она всегда передается с помощью какого-либо языка.
На уроках математики вы используете специальный язык, в основе которого — цифры, знаки арифметических действий и отношений. Они составляют алфавит языка математики.
На уроках физики при рассмотрении какого-либо физического явления вы используете характерные для данного языка специальные символы, из которых составляете формулы. Формула — это слово на языке физики.
На уроках химии вы также используете определенные символы, знаки, объединяя их в «слова» данного языка.
Существует язык глухонемых, где символы языка — определенные знаки, выражаемые мимикой лица и движениями рук.
Основу любого языка составляет алфавит — конечный набор знаков (символов) любой природы, из которых формируется сообщение.
Языки делятся на естественные (разговорные) и формальные. Алфавит естественных языков зависит от национальных традиций. Формальные языки встречаются в специальных областях человеческой деятельности (математике, физике, химии и т. д.). В мире насчитывается около 10 ООО разных языков, диалектов, наречий. Многие разговорные языки произошли от одного и того же языка. Например, от латинского языка образовались французский, испанский, итальянский и другие языки.
2.2. Кодирование информации
С появлением языка, а затем и знаковых систем расширились возможности общения между людьми. Это позволило хранить идеи, полученные знания и любые данные, передавать их различными способами на расстояние и в другие времена — не только своим современникам, но и будущим поколениям. До наших дней дошли творения предков, которые с помощью различных символов увековечили себя и свои деяния в памятниках и надписях. Наскальные рисунки (петроглифы) до сих пор служат загадкой для ученых. Возможно, таким способом древние люди хотели вступить в контакт с нами, будущими жителями планеты и сообщить о событиях их жизни.
Каждый народ имеет свой язык, состоящий из набора символов (букв): русский, английский, японский и многие другие. Вы уже познакомились с языком математики, физики, химии. Представление информации с помощью какого-либо языка часто называют кодированием.
Код — набор символов (условных обозначений) для представления информации. Кодирование — процесс представления информации в виде кода.
Водитель передает сигнал с помощью гудка или миганием фар. Кодом является наличие или отсутствие гудка, а в случае световой сигнализации — мигание фар или его отсутствие.
Вы встречаетесь с кодированием информации при переходе дороги по сигналам светофора. Код определяют цвета светофора — красный, желтый, зеленый.
В основу естественного языка, на котором общаются люди, тоже положен код. Только в этом случае он называется алфавитом. При разговоре этот код передается звуками, при письме — буквами. Одну и ту же информацию можно представить с помощью различных кодов. Например, запись разговора можно зафиксировать посредством русских букв или специальных стенографических значков.
По мере развития техники появлялись разные способы кодирования информации. Во второй половине XIX века американский изобретатель Сэмюэль Морзе изобрел удивительный код, который служит человечеству до сих пор. Информация кодируется тремя «буквами»: длинный сигнал (тире), короткий сигнал (точка) и отсутствие сигнала (пауза) для разделения букв. Таким образом, кодирование сводится к использованию набора символов, расположенных в строго определенном порядке.
Люди всегда искали способы быстрого обмена сообщениями. Для этого посылали гонцов, использовали почтовых голубей. У народов существовали различные способы оповещения о надвигающейся опасности: барабанный бой, дым костров, флаги и т. д. Однако использование такого представления информации требует предварительной договоренности о понимании принимаемого сообщения.
Знаменитый немецкий ученый Готфрид Вильгельм Лейбниц предложил еще в XVII веке уникальную и простую систему представления чисел. «Вычисление с помощью двоек. является для науки основным и порождает новые открытия. при сведении чисел к простейшим началам, каковы 0 и 1, везде появляется чудесный порядок».
В 1676 году Лейбниц занялся исследованием математических законов применительно к двоичной системе счисления. Лейбницу первому пришла мысль использовать двоичные числа в вычислительном устройстве. Однако числа в двоичной системе представлялись длинными цепочками двоичных разрядов, и это трудно было воспроизвести в техническом устройстве. Поэтому разработанная Лейбницем механическая разностная машина выполняла арифметические действия над десятичными числами.
В 1816 году английский математик Джордж Буль подхватил идею Лейбница и создал универсальный логический язык, подчиняющийся математическим законам. С помощью этого языка Буль предложил кодировать высказывания, а затем манипулировать ими подобно тому, как в математике манипулируют обычными числами.
В 1867 году американский ученый Чарльз Сандерс Пирс применил законы математической логики для описания электрических переключательных схем.
С помощью двух цифр 0 и 1 можно отображать не только числа, но и знакомые всем жизненные понятия, которые по своей сути имеют два противоположных состояния, например день и ночь, добро и зло, свет и тьма, истина и ложь и т. д.
Достижения ученых и изобретателей, вносивших свой вклад в развитие двоичной математики и логики на протяжении многих лет, нашли реальное воплощение только в середине XX века, когда была создана первая цифровая вычислительная машина. С тех пор прошло много лет, но и по сей день в основе работы всех устройств современного компьютера лежат законы математики и логики применительно к двоичной системе счисления.
2.3. Представление информации в компьютере
Единицы измерения объема информации в компьютере
Способ преобразования разнообразной информации в последовательность нулей и единиц двоичного кода, то есть записи ее на строгом математическом языке, широко используется в технических устройствах, в том числе и в компьютере.
С помощью двух цифр 0 и 1 можно закодировать любое сообщение. При создании первой вычислительной машины такой способ представления информации привлек к себе внимание именно простотой технической реализации: есть сигнал — это 1, нет сигнала — это 0.
Символы двоичного кода 0 и 1 принято называть двоичными цифрами или битами (от англ. binary digit — двоичный знак). Бит является минимальной единицей измерения объема информации. Объем информации в сообщении определяется количеством битов.
Бит — наименьшая единица измерения объема информации.
Более крупной единицей измерения объема информации служит 1 байт, состоящий из 8 битов.
Принято также использовать и более крупные единицы измерения объема информации, которые приведены в таблице 2.1. Число 1024 (210) является множителем при переходе к более высокой единице измерения.
Для преобразования информации в двоичные коды и обратно в компьютере должно быть организовано два процесса:
◊ кодирование — преобразование входной информации в машинную форму, то есть в двоичный код;
◊ декодирование — преобразование двоичного кода в форму, понятную человеку.
Кодирование обеспечивается устройствами ввода, а декодирование — устройствами вывода.
Таблица 2.1. Единицы измерения объема информации
Кодирование числовой информации
Числа в компьютере представляются в двоичной системе счисления, то есть посредством двух цифр — 0 и 1. Это позиционная система, из чего следует, что вес цифры 1 зависит от места (позиции), которое эта цифра занимает в числе. Любое число можно разложить по степеням основания системы счисления, в том числе и двоичной. Принято при работе с разными системами счисления внизу около числа ставить цифру для обозначения конкретной системы счисления, например, 11012, 12013, 32045, 305810, 8B50D16.
Для сравнения рассмотрим два примера представления чисел:
♦ в десятичной системе счисления число 305810 можно представить следующим образом:
305810 = 3х10 3 + 0х10 2 + 5х10 1 + 8×10 0 = 3х10 3 + 5х10 1 + 8×10 0 ,
где степени числа 10 (основания системы) соответствуют номеру позиции цифры в числе;
♦ в двоичной системе счисления число 11012 можно представить следующим образом:
11012 = 1х2 3 + 1х2 2 + 0x2 1 + 1×2 0 = 2 3 + 2 2 + 2 0 = 1310,
где степени числа 2 (основания системы) соответствуют номеру позиции цифры в числе.
В компьютере различают представление целых и действительных чисел.
Целые числа представляются в виде одного, двух или четырех байт со знаком или без знака. Форматы без знака существуют только для положительных чисел. В форматах со знаком знак числа определяет старший разряд: 0 — положительное, 1 — отрицательное. Такое представление получило название представления с фиксированной точкой.
Действительные числа в двоичной системе счисления представляются в экспоненциальном виде:
где М2 — мантисса числа в виде правильной дроби, а Р — порядок, показывающий, на сколько разрядов должна переместиться десятичная точка мантиссы для получения исходного числа.
Такое представление получило название представления с плавающей точкой.
Кодирование текстовой информации
Нажатие любой алфавитно-цифровой клавиши на клавиатуре приводит к тому, что в компьютер посылается сигнал в виде двоичного числа, представляющего собой одно из значений кодовой таблицы. Кодовая таблица — это внутреннее представление символов в компьютере. Долгое время во всем мире в качестве стандарта была принята таблица ASCII (American Standard Code for Informational Interchange -г- Американский стандартный код информационного обмена).
При таком кодировании для хранения двоичного кода одного символа выделялся 1 байт = 8 бит. Учитывая, что каждый бит может принимать значение 1 или 0, количество возможных кодовых комбинаций (сочетаний единиц и нулей) для отображения символов равнялось 28 = 256.
В стандарте ASCII коды первых 128 символов от 0 до 127 отводились для цифр, букв латинского алфавита и управляющих символов. Вторая половина кодовой таблицы (от 128 до 255) американским стандартом не была определена и предназначалась для символов национальных алфавитов, псевдографики и некоторых математических символов.
В настоящее время для кодирования текстовой информации в основном используется стандарт Unicode, как результат сотрудничества Международной организации по стандартизации с ведущими производителями компьютеров и программного обеспечения. Цель создания этого стандарта — единая таблица для всех национальных языков (для 25 реально существующих письменностей).
Для кодирования алфавитов всех национальных языков достаточно 16-битного представления (по 2 байта на символ). Каждому национальному алфавиту выделен свой блок с кодами символов этой письменности.
К настоящему времени кодирование всех официальных письменностей можно считать завершенным. Unicode 3.2 помимо русского языка поддерживает следующие языки народов России с дополнительными кириллическими буквами: башкирский, бурятский, калмыцкий, коми, ненецкий, осетинский и многие другие.
Как перспектива развития стандарта Unicode — это освоение 21-битного пространства кодов для кодирования письменности «мертвых» языков, дополнительных китайских иероглифов и искусственно созданных алфавитов.
Кодирование графической информации
Создавать и хранить графические объекты в компьютере можно двумя способами — как растровое или как векторное изображение. Для каждого вида изображения используется свой способ кодирования.
Растровое изображение представляет собой совокупность точек, используемых для его отображения на экране монитора. Объем растрового изображения определяется как произведение количества точек и информационного объема одной точки, который зависит от количества возможных цветов. Чем больше цветов, тем длиннее должен быть код данного цвета. Количество битов на кодирование одного цвета принято называть глубиной цвета.
Для черно-белого изображения информационный объем одной точки равен 1 биту, так как точка может быть либо черной, либо белой,-что можно закодировать двумя цифрами — 0 или 1.
Рассмотрим, сколько потребуется бит для отображения цветной точки: для 8 цветов необходимо 3 бита; для 16 цветов — 4 бита; для 256 цветов — 8 битов (1 байт).
Векторное изображение представляет собой графический объект, состоящий из графических примитивов. Каждый примитив состоит из элементарных отрезков кривых, параметры которых (координаты узловых точек, радиус кривизны и пр.) описываются математическими формулами. Для каждой линии указываются ее тип (сплошная, пунктирная, штрих-пунктир- ная), толщина и цвет, а замкнутые фигуры дополнительно характеризуются типом заливки. Кодирование векторных изображений выполняется различными способами в зависимости от прикладной среды. В частности, формулы, описывающие отрезки кривых, могут кодироваться как обычная буквенно-цифро- вая информация для дальнейшей обработки специальными программами.
Кодирование звука
Звук представляет собой непрерывный сигнал — звуковую волну с меняющейся амплитудой и частотой. Громкость сигнала зависит от его амплитуды (чем больше амплитуда, тем громче сигнал). Тон сигнала зависит от его частоты (чем больше частота сигнала, тем выше тон). Частота звуковой волны выражается числом колебаний в секунду и измеряется в герцах (Гц, Hz). Человеческое ухо способно воспринимать звуки в диапазоне от 20 Гц до 20 кГц. Этот диапазон частот называют звуковым.
При кодировании звуковой информации непрерывный сигнал разбивается на равные по длительности интервалы времени (дискреты). При этом предполагается, что на каждом участке сигнал не изменяется, то есть имеет постоянный уровень, который может быть представлен двоичным кодом. Очевидно, что такая замена реального сигнала на совокупность уровней отражается на качестве звука. Поэтому чем меньше временные интервалы (дискреты), тем точнее сигнал можно представить в виде кодов.
Важной характеристикой при кодировании звука является частота дискретизации — это количество измерений уровней сигнала за 1 секунду. Другой важной характеристикой является глубина кодирования звука — количество битов, отводимое на одно измерение уровня звукового сигнала.
Кто хоть раз играл в компьютерные игры или, например, получал справку о текущем времени по телефону, имел дело с синтезированным звуком. Вывод подобных звуков осуществляется синтезатором, который считывает из памяти последовательность хранящихся там звуковых кодов. На подобном принципе основан таблично-волновой способ кодирования. В заранее подготовленных таблицах хранятся образцы звуков окружающего мира, музыкальных инструментов и пр. и их числовые коды. Числовые коды выражают высоту тона, продолжительность и интенсивность звука и прочие параметры, характеризующие особенности звука. Поскольку в качестве образцов используются «реальные» звуки, то качество звука, полученного в результате синтеза, получается очень высоким и приближается к реальному качеству звучания.
Контрольные вопросы и задания
1. Какие формы представления информации вы знаете?
2. Представьте информацию о погоде в различной форме.
3. С помощью чего передается информация?
4. Что такое алфавит? Приведите примеры алфавитов.
5. Где применяются естественные языки? Приведите примеры.
6. Где применяются формальные языки? Приведите примеры.
7. Что такое код и кодирование?
8. Приведите примеры кодирования информации, используемой в математике, физике, химии, биологии, географии.
9. Какое значение имеет кодирование в развитии человечества?
10. Придумайте три своих способа кодирования русскйх букв, используя различные формы представления информации.
11. Какой алфавит нашел наибольшее распространение в различных сферах деятельности? Как называются символы этого алфавита?
12. Что такое один байт?
13. Укажите, что принято за единицу измерения объема информации: 1 байт, 1 бит, 1 килобит?
14. Что больше — 1 Кбайт или 1000 байт?
15. Какие единицы измерения объема информации вы знаете?
16. Укажите правильный порядок возрастания единиц измерения объема информации и укажите их соотнесение друг с другом:
а) бит, байт, гигабайт, килобайт;
б) байт, мегабайт, килобайт, гигабайт;
в) байт, килобайт, мегабайт, гигабайт;
г) байт, килобайт, гигабайт, мегабайт.
17. На стандартно оформленной машинописной странице должно быть 30 строк по 60 символов в каждой. Определите информационный объем страницы в битах (килобит) и байтах (килобайтах). Объем информации, содержащийся в одном символе (букве, цифре, специальном символе или пробеле), равен одному байту.
18. На стандартно оформленной машинописной странице помещается 30 строк по 60 символов в каждой. Определите информационный объем страницы в байтах и мегабайтах при кодировании в кодах ASCII и Unicode.
19. Как кодируется растровое изображение?
20. Что такое глубина цвета?
21. Как кодируется векторное изображение?
22. Как кодируется музыка?
23. Что такое глубина кодирования звука?