Единицей измерения информации на компьютере является
§ 4. Измерение информации
Основные темы параграфа:
• алфавитный подход к измерению информации;
• алфавит, мощность алфавита;
• информационный вес символа;
• информационный объем текста и единицы информации.
А теперь обсудим вопрос о том, как можно измерять информацию. Существует несколько подходов к измерению информации. Здесь мы рассмотрим только один, который называется алфавитным подходом 1 .
1 О другом подходе к измерению информации см. в разделе 1.1 второй части учебника.
Алфавитный подход к измерению информации
Вам хорошо известно, что для измерения таких величин, как, например, расстояние, масса, время, существуют эталонные единицы. Для расстояния — это метр, для массы — килограмм, для времени — секунда. Измерение происходит путем сопоставления измеряемой величины с эталонной единицей. Сколько раз эталонная единица укладывается в измеряемой величине, таков и результат измерения. Следовательно, и для измерения информации должна быть введена своя эталонная единица.
Алфавитный подход позволяет измерять информационный объем текста на некотором языке (естественном или формальном), не связанный с содержанием этого текста.
Алфавит. Мощность алфавита
Под алфавитом мы будем понимать набор букв, знаков препинания, цифр, скобок и др. символов, используемых в тексте. В алфавит также следует включить и пробел, т. е. пропуск между словами.
Полное число символов в алфавите принято называть мощностью алфавита. Будем обозначать эту величину буквой N. Например, мощность алфавита из русских букв и отмеченных дополнительных символов равна 54: 33 буквы + 10 цифр + 11 знаков препинания, скобки, пробел.
Информационный вес символа
При алфавитном подходе считается, что каждый символ текста имеет определенный информационный вес. Информационный вес символа зависит от мощности алфавита. А каким может быть наименьшее число символов в алфавите? Оно равно двум! Скоро вы узнаете, что такой алфавит используется в компьютере. Он содержит всего 2 символа, которые обозначаются цифрами «0» и «1». Его называют двоичным алфавитом. Изучая устройство и работу компьютера, вы узнаете, как с помощью всего двух символов можно представить любую информацию.
Информационный вес символа двоичного алфавита принят за единицу информации и называется 1 бит.
С увеличением мощности алфавита увеличивается информационный вес символов этого алфавита. Так один символ из четырехсимволъного алфавита (N = 4) «весит» 2 бита. Объяснение этому можно дать следующее: все символы такого алфавита можно закодировать всеми возможными комбинациями из двух цифр двоичного алфавита. Комбинацию из нескольких (двух, трех и т. д.) знаков двоичного алфавита назовем двоичным кодом.
Используя три двоичные цифры, можно составить 8 различных комбинаций.
Следовательно, если мощность алфавита равна 8, то информационный вес одного символа равен 3 битам.
Четырехзначным двоичным кодом может быть закодирован каждый символ из 16-символьного алфавита. И так далее.
Найдем зависимость между мощностью алфавита (N) и количеством знаков в коде (b) — разрядностью двоичного кода.
Заметим, что 2 = 2 1 , 4 = 2 2 , 8 = 2 3 , 16 = 2 4 .
В общем виде это записывается следующим образом:
Разрядность двоичного кода — это и есть информационный вес символа.
Информационный вес каждого символа, выраженный в битах (b), и мощность алфавита (N) связаны между собой формулой: N= 2 b .
Информационный объем текста и единицы информации
Информационный объем текста складывается из информационных весов составляющих его символов, Например, следующий текст, записанный с помощью двоичного алфавита:
содержит 40 символов, следовательно, его информационный объем равен 40 битам.
Сегодня для подготовки текстовых документов чаще всего применяются компьютеры. Алфавит, из которого составляется такой «компьютерный текст», содержит 256 символов. В алфавит такого размера можно поместить все практически необходимые символы: строчные и прописные латинские и русские буквы, цифры, знаки арифметических операций, всевозможные скобки, знаки препинания и пр.
Поскольку 256 = 2 8 , то один символ компьютерного алфавита «весит» 8 битов. Причем 8 битов информации — это настолько характерная величина, что ей даже присвоили свое название — байт.
1 байт = 8 битов.
Легко подсчитать информационный объем текста, если известно, что информационный вес одного символа равен 1 байту. Надо просто сосчитать число символов в тексте. Полученное значение и будет информационным объемом текста, выраженным в байтах.
Например, небольшая книжка, подготовленная с помощью компьютера, содержит 150 страниц. На каждой странице — 40 строк, в каждой строке — 60 символов (включая пробелы между словами). Значит, страница содержит 40 х 60 = 2400 байтов информации. Для вычисления информационного объема всей книги нужно полученную величину умножить на число страниц:
2400 байтов · 150 = 360 000 байтов.
Уже на таком примере видно, что байт — «мелкая» единица. А представьте, если нужно, например, измерить информационный объем целой библиотеки? В байтах это окажется громадным числом!
Для измерения больших информационных объемов используются более крупные единицы:
1 килобайт = 1 Кб = 2 10 байтов = 1024 байта
1 мегабайт = 1 Мб = 2 10 Кб = 1024 Кб
1 гигабайт = 1 Гб = 2 10 Мб = 1024 Мб
Следовательно, информационный объем вышеупомянутой книги равен приблизительно 360 килобайтам. А если посчитать точнее, то получится:
360000/1024 = 351,5625 Кб.
351,5625/1024 — 0,34332275 Мб.
В заключение еще раз обратим внимание на важное свойство рассмотренного здесь алфавитного подхода. При его использовании содержательная сторона текста в учет не берется. Текст, состоящий из бессмысленного сочетания символов, будет иметь ненулевой информационный объем.
Коротко о главном
Алфавитный подход — это способ измерения информационного объема текста, не связанного с его содержанием.
Алфавит — это вся совокупность символов, используемых в некотором языке для представления информации. Мощность алфавита — это число символов в нем.
1 бит — информационный вес одного символа двухсимволъного алфавита (N= 2).
Информационный вес символа (разрядность двоичного кода) (b) и мощность алфавита (N) связаны формулой: N = 2 b .
Информационный объем текста равен сумме информационных весов всех символов, составляющих текст.
1 байт — информационный вес символа из алфавита мощностью 2 8 = 256 символов. 1 байт — 8 битов.
Байт, килобайт, мегабайт, гигабайт — единицы измерения информации. Каждая следующая единица больше предыдущей в 1024 (2 10 ) раза.
Вопросы и задания
1. Что такое алфавит?
2. Что такое мощность алфавита?
3. Как определяется информационный объем текста при использовании алфавитного подхода?
4. Текст составлен с использованием алфавита мощностью 64 символа и содержит 100 символов. Каков информационный объем текста?
5. Что такое байт, килобайт, мегабайт.
6. Информационный объем текста, подготовленного с помощью компьютера, равен 3,5 Кб. Сколько символов содержит этот текст?
7. Два текста содержат одинаковое количество символов. Первый текст составлен в алфавите мощностью 32 символа, второй — мощностью 64 символа, Во сколько раз отличаются информационные объемы этих текстов?
Чему вы должны научиться, изучив главу 1
• Различать декларативные и процедурные знания.
• Называть виды информационных процессов.
• Определять информационный объем текста.
• Переводить количество информации из одних единиц в другие.
И. Семакин, Л. Залогова, С. Русаков, Л. Шестакова, Информатика, 8 класс
Отослано читателями из интернет-сайтов
Вся информатика онлайн, список тем по предметам, сборник конспектов по информатике, домашняя работа, вопросы и ответы, сочинения по информатике 8 класс, планы уроков
Если у вас есть исправления или предложения к данному уроку, напишите нам.
Если вы хотите увидеть другие корректировки и пожелания к урокам, смотрите здесь — Образовательный форум.
Единицей измерения информации на компьютере является
2. Единицы измерения данных
Объем данных (V) – количество байт, которое требуется для их хранения в памяти электронного носителя информации.
Память носителей в свою очередь имеет ограниченную ёмкость, т.е. способность вместить в себе определенный объем.
· Бит — базовая единица измерения количества информации , равная количеству информации, содержащемуся в опыте, имеющем два равновероятных исхода. Это тождественно количеству информации в ответе на вопрос, допускающий ответы «да» либо «нет» и никакого другого (то есть такое количество информации, которое позволяет однозначно ответить на поставленный вопрос). Один разряд двоичного кода (двоичная цифра). Может принимать только два взаимоисключающих значения: да/нет, 1/0, включено /выключено, и т. п. В электронике 1 двоичному разряду соответствует 1 двоичный триггер, который имеет два устойчивых состояния.
· Байт (англ. byte ) — единица хранения и обработки цифровой информации. В настольных вычислительных системах байт считается равным восьми битам, в этом случае он может принимать одно из 256 (2 8 ) различных значений. Следует понимать, что количество бит в байте не является однозначной величиной и может варьироваться в широком диапазоне. Так, в первых компьютерах размер байта был равен 6 битам. В суперкомпьютерах, вследствие используемой адресации, один байт содержит 32 бита. Для того , чтобы подчеркнуть, что имеется в виду восьмибитный байт, а также во избежание широко распростанённого заблуждения, что в одном байте исключительно восемь бит, в описании сетевых протоколов используется термин «октет» (лат. octet ). Байт в современных x86-совместимых компьютерах — это минимально адресуемый набор фиксированного числа битов.
· Килоба́йт ( кБ , Кбайт, КБ) м., скл . — единица измерения количества информации, равная в зависимости от контекста 1000 или 1024 (2 10 ) стандартным (8-битным) байтам. Применяется для указания объёма памяти в различных электронных устройствах.
1 килобайт (КБ) = 8 килобит (Кб)
Название «килобайт» часто применяется для 1024 байт, но формально неверно, так как приставка кил о- , традиционно означает умножение на 1000, а не 1024. Согласно предложению МЭК, формально правильной (хотя и относительно редко используемой) для 2 10 является двоичная приставка киби —.
Исторически сложилось, что со словом «байт» несколько некорректно (вместо 1000 = 10 3 принято 1024 = 2 10 ) использовали и продолжают использовать приставки СИ: 1 Кбайт = 1024 байт, 1 Мбайт = 1024 Кбайт, 1 Гбайт = 1024 Мбайт и т. д. При этом обозначение Кбайт начинают с прописной буквы в отличие от строчной буквы «к» для обозначения множителя 10 3 .
· Мегаба́йт (Мбайт, М, МБ) м., скл . — единица измерения количества информации, равная, в зависимости от контекста, 1 000 000 (10 6 ) или 1 048 576 (2 20 ) стандартным (8-битным) байтам. Сокращенное название МБ отличается от Мегабита (Мб) строчной буквой (но на самом деле иногда происходит некоторая путаница в сокращениях). Применяется для указания объёма памяти в различных электронных устройствах.
· Гигабайт (Гбайт, Г, ГБ) — кратная единица измерения количества информации, равная 10 9 стандартным (8-битным) байтам или 1 000 000 000 байтам. Применяется для указания объёма памяти в различных электронных устройствах. От сложившегося положения нередко страдают потребители продукции крупных корпораций, производящих жёсткие диски и карты флэш-памяти . Приобретая изделие, в маркировке которого указана его реальная емкость, например, 1 гигабайт или 1 000 000 000 байт они полагают, что приобретают изделие емкостью 1 гибибайт или 1 073 741 824 байт, что нередко приводит к непониманию и недовольству.
Бай т- мельчайшая адресуемая единица информации
Килобайт – базовая единица
Машинное слово — машиннозависимая и платформозависимая величина, измеряемая в битах или байтах , равная разрядности регистров процессора и/или разрядности шины данных . На ранних компьютерах размер слова совпадал также с минимальным размером адресуемой информации (разрядностью данных, расположенных по одному адресу); на современных компьютерах минимальным адресуемым блоком информации обычно является байт, а слово состоит из нескольких байтов. Машинное слово определяет следующие характеристики аппаратной платформы :
· разрядность данных , обрабатываемых процессором;
· разрядность адресуемых данных (разрядность шины данных);
· максимальное значение беззнакового целого типа , напрямую поддерживаемого процессором: если результат арифметической операции превосходит это значение, то происходит переполнение ;
· максимальный объём оперативной памяти , напрямую адресуемой процессором.
Кластер — в некоторых типах файловых систем логическая единица хранения данных в таблице размещения файлов, объединяющая группу секторов. Как правило, это наименьшее место на диске, которое может быть выделено для хранения файла.
Се́ктор диска — минимальная адресуемая единица хранения информации на дисковых запоминающих устройствах. Является частью дорожки диска. У большинства устройств размер сектора составляет 512 байт, либо 2048 байт (например, у оптических дисков).
Для более эффективного использования места на диске файловая система может объединять секторы в кластеры, размером от 512 байт (один сектор) до 64 кбайт (128 секторов). Переход к кластерам произошел потому, что размер таблицы FAT был ограничен, а размер диска увеличивался. Количество секторов на цилиндрах ранее было одинаковым, на современных дисках количество секторов на цилиндр разное, но контроллер жёсткого диска сообщает о некоем условном количестве дорожек, секторов и сторон, хотя позднее была создана система обращения к дискам, в которой все секторы пронумерованы. Первый сектор диска обычно является загрузочным.
Единицы измерения информации.
Для измерения длины, массы, времени, силы тока и т.д. придуманы приборы и процедуры измерения. Чтобы узнать длину стержня, достаточно приложить к нему линейку с делениями, силу тока можно измерить амперметром. А как узнать количество информации в некотором сообщении, в каких единицах эту информацию измерять? Для двоичных сообщений в качестве такой числовой меры используется количество бит в сообщении. Это количество называют информационным объемом сообщения. Например, сообщение «МИРУ МИР» имеет информационный объем 8 байт (64 бит).
Биты и байты используются также для измерения «емкости», размера памяти и для измерения скорости передачи двоичных сообщений. Скорость передачи измеряется количеством передаваемых бит в секунду (например, 19200 бит/с).
Наряду с битами и байтами для измерения количества информации в двоичных сообщениях используются и более крупные единицы (более удобные для измерения больших объемов информации):
1 Кбит (один килобит) = 2 10 =1024 бит (прибл. 1 тыс. бит)
1 Мбит (один мегабит) = 2 20 =1048576 бит (прибл. 1 млн. бит)
1 Гбит (один гигабит) = 2 30 = (прибл.)10 9 бит (миллиард бит)
1 Кбайт (один килобайт) = 2 10 =1024 байт (прибл. 1 тыс. байт)
1 Мбайт (один мегабайт) = 2 20 =1048576 байт (прибл. 1 млн. байт)
1 Гбайт (один гигабайт) = 2 30 = ( прибл. 1 миллиард байт)
К единицам измерения многих физических величин мы привыкли, и нам не нужно пояснять, что такое 1 миллиметр или 10 километров. А бит, байт, килобайт, мегабайт, гигабайт — много это или мало?
Например, в учебнике на страницу помещается чуть меньше 50 строк, в каждой строке — примерно 60 символов. Таким образом, полностью заполненная текстом страница учебника имеет информационный объем около 3000 байт (3 Кбайт). Если считать, что в учебнике около 200 страниц, то получаем информационный объем учебника равный около 600 Кбайт или 0,6 Мбайт. Если человек говорит по 8 часов в день без перерыва, то за 70 лет жизни он наговорит около 10 Гбайт информации (это 5 млн. страниц — стопка бумаги высотой 500 м.)
Один черно-белый телевизионный кадр (при 32 градациях яркости каждой точки) содержит примерно 300 Кбайт информации. Цветной кадр, образованный из трех кадров основных цветов (красный, синий, зеленый), содержит уже около Мбайта информации. А 1,5-часовой цветной телевизионный художественный фильм (при частоте 25 кадров в секунду) — 135 Гбайт.
Если на условной шкале изобразить бит примерно одним миллиметром (точнее, 1.25 мм), то байт в этом масштабе будет представлен сантиметром, килобайт — десятиметровым отрезком, мегабайт — десятикилометровым отрезком, ну а гигабайт вытянется в 10 000 километров — это расстояние от Москвы до Владивостока. Как видите, диапазон, который охватывают единицы измерения информации, очень велик.
Рассмотрим примеры задач:
1. Найти неизвестные x и y, если верны соотношения:
Приведем левую и правую части каждого уравнения системы к
одной единице измерения :
Отбрасывая теперь размерности, получаем:
Отсюда следует, что x = 17, y = 7
2. Человек способен различать более 100 градаций яркости. Сколько бит необходимо, чтобы их закодировать, т.е. какова должна быть минимальная разрядность битовой комбинации?
Очевидно, что для кодировки одного (двух) цветов нужна однобитовая комбинация (например, цвет белый — бит 0, черный — бит 1), кодируются 2 1 цвета; для кодирования 3-4 цветов необходима двухбитовая комбинация (например, белый — 00, желтый — 01, синий — 10, черный — 11), кодируются 2 2 цвета; для кодирования 5-8 цветов необходима трехбитовая комбинация (например, белый — 000, желтый — 001, синий — 010, черный — 011, красный — 100, голубой — 101, зеленый — 110, бежевый — 111), кодируются 2 3 цвета. Отсюда видно (а это можно доказать методом математической индукции), что для кодировки 100 цветов необходимо выбрать число разрядов n так, чтобы было выполнено неравенство 2 n >= 100. Так как 2 7 = 128 >= 100, а 2 6 = 64
3. Сколько различных цветов можно закодировать двенадцатиразрядными битовыми комбинациями?
Такими битовыми комбинациями можно закодировать не более чем 2 12 = 4096 различных цветов.
4. Экран дисплея имеет разрешение 1024×512 точек, причем каждая точка может быть одного из 256 цветов. Определить, сколько всего бит нужно для запоминания «одного экрана» в видеопамяти.
Количество точек (пикселов) экрана 1024×512 = 2 10 x2 9 = 2 19 . Так как каждая точка может принимать любой из 256 = 28 цветов, то для запоминания каждого цвета необходим 1 байт = 2 3 бит. Следовательно, всего необходимо 2 19 x 2 3 = 2 22 бит.
Количество и объем информации
Количество информации можно рассматривать как меру уменьшения неопределенности знания при получении информационных сообщений.
Рассмотренный выше подход к информации как мере уменьшения неопределенности знания позволяет количественно измерять информацию. Существует формула, которая связывает между собой количество возможных информационных сообщений N и количество информации I, которое несет полученное сообщение:
Бит. Для количественного выражения любой величины необходимо сначала определить единицу измерения. Так, для измерения длины в качестве единицы выбран метр, для измерения массы — килограмм и т. д. Аналогично, для определения количества информации необходимо ввести единицу измерения.
За единицу количества информации принимается такое количество информации, которое содержится в информационном сообщении, уменьшающем неопределенность знания в два раза. Такая единица названа битом. дискретизация цифровой преобразование кодирование
Если вернуться к рассмотренному выше получению информационного сообщения о результатах зачета, то здесь неопределенность как раз уменьшается в два раза и, следовательно, количество информации, которое несет сообщение, равно 1 биту.
Производные единицы измерения количества информации. Минимальной единицей измерения количества информации является бит, а следующей по величине единицей — байт, причем:
1 байт = 8 битов = 23битов.
В информатике система образования кратных единиц измерения несколько отличается от принятых в большинстве наук. Традиционные метрические системы единиц, например Международная система единиц СИ, в качестве множителей кратных единиц используют коэффициент 10n, где n = 3, 6, 9 и т. д., что соответствует десятичным приставкам «Кило» (103), «Мега» (106), «Гига» (109) и т. д.
В компьютере информация кодируется с помощью двоичной знаковой системы, и поэтому в кратных единицах измерения количества информации используется коэффициент 2n
Так, кратные байту единицы измерения количества информации вводятся следующим образом:
- 1 килобайт (Кбайт) = 210байт = 1024 байт;
- 1 мегабайт (Мбайт) = 210Кбайт = 1024 Кбайт;
- 1 гигабайт (Гбайт) = 210Мбайт = 1024 Мбайт.
Для измерения длины есть такие единицы, как миллиметр, сантиметр, метр, километр. Известно, что масса измеряется в граммах, килограммах, центнерах и тоннах. Бег времени выражается в секундах, минутах, часах, днях, месяцах, годах, веках. Компьютер работает с информацией и для измерения ее объема также имеются соответствующие единицы измерения.
Мы уже знаем, что компьютер воспринимает всю информацию через нули и единички.Бит-это минимальная единица измерения информации, соответствующая одной двоичной цифре («0» или «1»). Байт состоит из восьми бит. Используя один байт, можно закодировать один символ из 256 возможных (256 = 28). Таким образом, один байт равен одному символу, то есть 8 битам:
1 символ = 8 битам = 1 байту.
Изучение компьютерной грамотностипредполагает рассмотрение и других, более крупных единиц измерения информации.
- 1 байт = 8 бит
- 1 Кб (1Килобайт) = 210байт = 2*2*2*2*2*2*2*2*2*2 байт = = 1024 байт (примерно 1 тысяча байт — 103байт)
- 1 Мб (1Мегабайт) = 220байт = 1024 килобайт (примерно 1 миллион байт — 106байт)
- 1 Гб (1Гигабайт) = 230байт = 1024 мегабайт (примерно 1 миллиард байт — 109байт)
- 1 Тб (1Терабайт) = 240байт = 1024 гигабайт (примерно 1012байт). Терабайт иногда называют тонна.
- 1 Пб (1Петабайт) = 250байт = 1024 терабайт (примерно 1015байт).
- 1Эксабайт=260байт = 1024 петабайт (примерно 1018байт).
- 1Зеттабайт=270байт = 1024 эксабайт (примерно 1021байт).
- 1Йоттабайт=280байт = 1024 зеттабайт (примерно 1024байт).
В приведенной выше таблице степени двойки (210, 220, 230и т.д.) являются точными значениями килобайт, мегабайт, гигабайт. А вот степени числа 10 (точнее, 103, 106, 109и т.п.) будут уже приблизительными значениями, округленными в сторону уменьшения. Таким образом, 210= 1024 байта представляет точное значение килобайта, а 103= 1000 байт является приблизительным значением килобайта.
Такое приближение (или округление) вполне допустимо и является общепринятым.
Ниже приводится таблица байтов с английскими сокращениями (в левой колонке):
- 1 Kb ~ 103b = 10*10*10 b= 1000 b — килобайт
- 1 Mb ~ 106b = 10*10*10*10*10*10 b = 1000000 b — мегабайт
- 1 Gb ~ 109b — гигабайт
- 1 Tb ~ 1012b — терабайт
- 1 Pb ~ 1015b — петабайт
- 1 Eb ~ 1018b — эксабайт
- 1 Zb ~ 1021b — зеттабайт
- 1 Yb ~ 1024b — йоттабайт
Выше в правой колонке приведены так называемые «десятичные приставки», которые используются не только с байтами, но и в других областях человеческой деятельности. Например, приставка «кило» в слове «килобайт» означает тысячу байт, также как в случае с километром она соответствует тысяче метров, а в примере с килограммом она равна тысяче грамм.
Возникает вопрос: есть ли продолжение у таблицы байтов? В математике есть понятие бесконечности, которое обозначается как перевернутая восьмерка: ?.
Понятно, что в таблице байтов можно и дальше добавлять нули, а точнее, степени к числу 10 таким образом: 1027, 1030, 1033 и так до бесконечности. Но зачем это надо? В принципе, пока хватает терабайт и петабайт. В будущем, возможно, уже мало будет и йоттабайта.
Напоследок парочка примеров по устройствам, на которые можно записать терабайты и гигабайты информации. Есть удобный «терабайтник» — внешний жесткий диск, который подключается через порт USB к компьютеру. На него можно записать терабайт информации. Особенно удобно для ноутбуков (где смена жесткого диска бывает проблематична) и для резервного копирования информации. Лучше заранее делать резервные копии информации, а не после того, как все пропало.
Флешки бывают 1 Гб, 2 Гб, 4 Гб, 8 Гб, 16 Гб, 32 Гб и 64 Гб.
CD-диски могут вмещать 650 Мб, 700 Мб, 800 Мб и 900 Мб.
DVD-диски рассчитаны на большее количество информации: 4.7 Гб, 8.5 Гб, 9.4 Гб и 17 Гб.