В чем измеряется объем информации на компьютере

Измерение информации. Алфавитный подход к измерению информации. Мощность алфавита. Информационный объем текста

Алфавитный подход к измерению информации Вам хорошо известно, что для измерения таких величин, как, например, расстояние, масса, время, существуют эталонные единицы. Для расстояния — это метр, для массы — килограмм, для времени — секунда. Измерение происходит путем сопоставления измеряемой величины с эталонной единицей. Сколько раз эталонная единица укладывается в измеряемой величине, таков и результат измерения. Следовательно, и для измерения информации должна быть введена своя эталонная единица. Алфавитный подход позволяет измерять информационный объем текста на некотором языке (естественном или формальном), не связанный с содержанием этого текста.

Алфавит. Мощность алфавита
Под алфавитом мы будем понимать набор букв, знаков препинания, цифр, скобок и др. символов, используемых в тексте. В алфавит также следует включить и пробел, т. е. пропуск между словами.
Полное число символов в алфавите принято называть мощностью алфавита. Будем обозначать эту величину буквой N. Например, мощность алфавита из русских букв и отмеченных дополнительных символов равна 54:33 буквы + 10 цифр + 11 знаков препинания, скобки, пробел.

Информационный вес символа
При алфавитном подходе считается, что каждый символ текста имеет определенный информационный вес. Информационный вес символа зависит от мощности алфавита. А каким может быть наименьшее число символов в алфавите? Оно равно двум! Скоро вы узнаете, что такой алфавит используется в компьютере. Он содержит всего 2 символа, которые обозначаются цифрами «0» и «1». Его называют двоичным алфавитом. Изучая устройство и работу компьютера, вы узнаете, как с помощью всего двух символов можно представить любую информацию.

Информационный вес символа двоичного алфавита принят за единицу информации и называется 1 бит.

Меры и единицы количества и объема информации

Для информации существуют свои единицы измерения информации. Если рассматривать сообщения информации как последовательность знаков, то их можно представлять битами, а измерять в байтах, килобайтах, мегабайтах, гигабайтах, терабайтах и петабайтах.

Единицей измерения количества информации является бит — это наименьшая (элементарная) единица. 1бит — это количество информации, содержащейся в сообщении, которое вдвое уменьшает неопределенность знаний о чем-либо.

Байт — основная единица измерения количества информации. Байтом называется последовательность из 8 битов. Байт — довольно мелкая единица измерения информации. Например, 1 символ — это 1 байт.

Производные единицы измерения количества информации:

1 килобайт (Кб)=1024 байта =210 байтов

1 мегабайт (Мб)=1024 килобайта =210 килобайтов=220 байтов

1 гигабайт (Гб)=1024 мегабайта =210 мегабайтов=230 байтов

1 терабайт (Гб)=1024 гигабайта =210 гигабайтов=240 байтов

Запомните, приставка КИЛО в информатике — это не 1000, а 1024, то есть 210.

Уроки 5 — 7
Измерение информации (§§ 3 — 4)

Вопрос об измерении количества информации является очень важным как для науки, так и для практики. В самом деле, если информация является предметом нашей деятельности, мы ее храним, передаем, принимаем, обрабатываем. Поэтому важно договориться о способе ее измерения, позволяющем, например, ответить на вопросы: достаточно ли места на носителе, чтобы разместить нужную нам информацию, или сколько времени потребуется, чтобы передать ее по имеющемуся каналу связи. Величина, которая нас в этих ситуациях интересует, называется объемом информации. В таком случае говорят об алфавитном, или объемном, подходе к измерению информации.

Алфавитный подход к измерению информации применяется в цифровых (компьютерных) системах хранения и передачи информации. В этих системах используется двоичный способ кодирования информации. При алфавитном подходе для определения количества информации имеет значение лишь размер (объем) хранимого и передаваемого кода. Алфавитный подход еще называют объемным подходом. Из курса информатики 7-9 классов вы знаете, что если с помощью i-разрядного двоичного кода можно закодировать алфавит, состоящий из N символов (где N — целая степень двойки), то эти величины связаны между собой по формуле:

2 i = N.

Число N называется мощностью алфавита.

Если, например, i = 2, то можно построить 4 двухразрядные комбинации из нулей и единиц, т. е. закодировать 4 символа. При i = 3 существует 8 трехразрядных комбинаций нулей и единиц (кодируется 8 символов):

image

Английский алфавит содержит 26 букв. Для записи текста нужны еще как минимум шесть символов: пробел, точка, запятая, вопросительный знак, восклицательный знак, тире. В сумме получается расширенный алфавит мощностью в 32 символа.

Поскольку 32 = 2 5 , все символы можно закодировать всевозможными пятиразрядными двоичными кодами от 00000 до 11111. Именно пятиразрядный код использовался в телеграфных аппаратах, появившихся еще в XIX веке. Телеграфный аппарат при вводе переводил английский текст в двоичный код, длина которого в 5 раз больше, чем длина исходного текста.

image

В двоичном коде каждая двоичная цифра несет одну единицу информации, которая называется 1 бит.

image

Бит является основной единицей измерения информации.

Длина двоичного кода, с помощью которого кодируется символ алфавита, называется информационным весом символа. В рассмотренном выше примере информационный вес символа расширенного английского алфавита оказался равным 5 битам.

Информационный объем текста складывается из информационных весов всех составляющих текст символов. Например, английский текст из 1000 символов в телеграфном сообщении будет иметь информационный объем 5000 битов.

Алфавит русского языка включает 33 буквы. Если к нему добавить еще пробел и пять знаков препинания, то получится набор из 39 символов. Для двоичного кодирования символов такого алфавита пятиразрядного кода уже недостаточно. Нужен как минимум 6-разрядный код. Поскольку 2 6 = 64, остается еще резерв для 25 символов (64 — 39 = 25). Его можно использовать для кодирования цифр, всевозможных скобок, знаков математических операций и других символов, встречающихся в русском тексте. Следовательно, информационный вес символа в расширенном русском алфавите будет равен 6 битам. А текст из 1000 символов будет иметь объем 6000 битов.

image

Итак, если i — информационный вес символа алфавита, а К — количество символов в тексте, записанном с помощью этого алфавита, то информационный объем I текста выражается формулой:

I = К x i (битов).

Идея измерения количества информации в сообщении через длину двоичного кода этого сообщения принадлежит выдающемуся российскому математику Андрею Николаевичу Колмогорову. Согласно Колмогорову, количество информации, содержащееся в тексте, определяется минимально возможной длиной двоичного кода, необходимого для представления этого текста.

Для определения информационного веса символа полезно знать ряд целых степеней двойки. Вот как он выглядит в диапазоне от 2 1 до 2 10 :

image

Поскольку мощность N алфавита может не являться целой степенью двойки, информационный вес символа алфавита мощности N определяется следующим образом. Находится ближайшее к N значение во второй строке таблицы, не меньшее чем N.

Соответствующее значение i в первой строке будет равно информационному весу символа.

Пример. Определим информационный вес символа алфавита, включающего в себя все строчные и прописные русские буквы (66); цифры (10); знаки препинания, скобки, кавычки (10). Всего получается 86 символов.

Для двоичного представления текстов в компьютере чаще всего применяется восьмиразрядный код. С помощью восьмиразрядного кода можно закодировать алфавит из 256 символов, поскольку 256 = 2 8 . В стандартную кодовую таблицу (например, используемую в ОС Windows таблицу ANSI) помещаются все необходимые символы: английские и русские буквы — прописные и строчные, цифры, знаки препинания, знаки арифметических операций, всевозможные скобки и пр.

image

Более крупной, чем бит, единицей измерения информации является байт: 1 байт = 8 битов.

image

Информационный объем текста в памяти компьютера измеряется в байтах. Он равен количеству символов в записи текста.

Одна страница текста на листе формата А4 кегля 12 с одинарным интервалом между строками в компьютерном представлении будет иметь объем 4000 байтов, так как на ней помещается примерно 4000 знаков.

Помимо бита и байта, для измерения информации используются и более крупные единицы:

Объем той же страницы текста будет равен приблизительно 3,9 Кб. А книга из 500 таких страниц займет в памяти компьютера примерно 1,9 Мб.

image

В компьютере любые виды информации: тексты, числа, изображения, звуки — представляются в форме двоичного кода.

image

Объем информации любого вида, выраженный в битах, равен длине двоичного кода, в котором эта информация представлена.

image

Вопросы и задания

1. Есть ли связь между алфавитным подходом к измерению информации и содержанием информации?
2. В чем можно измерить объем письменного или печатного текста?
3. Оцените объем одной страницы данного учебника в байтах.
4. Что такое бит с позиции алфавитного подхода к измерению информации?
5. Как определяется информационный объем текста по А. Н. Колмогорову?
6. Какой информационный вес имеет каждая буква русского алфавита?
7. Какие единицы используются для измерения объема информации на компьютерных носителях?
8. Сообщение, записанное буквами из 64-символьного алфавита, содержит 100 символов. Какой объем информации оно несет?
9. Сколько символов содержит сообщение, записанное с помощью 16-символьного алфавита, если его объем составляет 1/16 Мб?
10. Сообщение занимает 2 страницы и содержит 1/16 Кб информации. На каждой странице 256 символов. Какова мощность используемого алфавита?
11. Возьмите страницу текста из данного учебника и подсчитайте информационные объемы текста, получаемые при кодировании его семиразрядным и восьмиразрядным кодами. Результаты выразите в килобайтах и мегабайтах.

Следующая страница Измерение информации. Содержательный подход

Единицы измерения информации

В современные компьютеры мы можем вводить текстовую информацию, числовые значения, а также графическую и звуковую информацию. Количество информации, хранящейся в ЭВМ, измеряется ее “длиной” (или “объемом”), которая выражается в битах. Бит— минимальная единица измерения информации (от английского BInary digiT — двоичная цифра). Каждый бит может принимать значение 0 или 1. Битом также называют разряд ячейки памяти ЭВМ. Для измерения объема хранимой информации используются следующие единицы:

1 Кбайт= 1024 байт (Кбайт читается как килобайт);

1 Мбайт= 1024 Кбайт (Мбайт читается как мегабайт);

1 Гбайт= 1024 Мбайт (Гбайт читается как гигабайт).

Бит (от англ. binary digit; также игра слов: англ. bit — немного)

По Шеннону бит — это двоичный логарифм вероятности равновероятных событий или сумма произведений вероятности на двоичный логарифм вероятности при равновероятных событиях.

Один разряд двоичного кода (двоичная цифра). Может принимать только два взаимоисключающих значения: да/нет, 1/0, включено/выключено, и т.п.

Базовая единица измерения количества информации, равная количеству информации, содержащемуся в опыте, имеющем два равновероятных исхода. Это тождественно количеству информации в ответе на вопрос, допускающий ответы «да» либо «нет» и никакого другого (то есть такое количество информации, которое позволяет однозначно ответить на поставленный вопрос). В одном двоичном разряде содержится один бит информации.

В вычислительной технике и сетях передачи данных обычно значения 0 и 1 передаются различными уровнями напряжения либо тока. Например, в микросхемах на основе TTL 0 представляется напряжением в диапазоне от +0 до + 3 В, а 1 в диапазоне от 4,5 до 5,0 В.

Скорость передачи данных в сети обычно измеряется битами в секунду. Примечательно, что с ростом скорости передачи данных, бит приобрёл также ещё одно метрическое выражение: длину. Так, в современной гигабитной сети (1 Гигабит/сек) на один бит приходится примерно 30 метров провода. Из-за этого сложность сетевых адаптеров существенно возросла. Раньше, например, в одно-мегабитных сетях длина бита в 30 км была почти всегда заведомо больше длины кабеля между двумя устройствами.

В вычислительной технике, особенно в документации и стандартах, слово «бит» часто применяется в значении двоичный разряд. Например: первый бит — первый двоичный разряд байта или слова, о котором идёт речь.

В настоящее время бит — это наименьшая возможная единица измерения информации в вычислительной технике, но интенсивные исследования в области квантовых компьютеров предполагают наличие q-битов.

Байт (англ. byte) — единица измерения количества информации, равная обычно восьми битам, может принимать 256 (2 8 ) различных значений.

Вообще, байт— это последовательность битов, число которых фиксировано, минимальный адресуемый объём памяти в компьютере. В современных компьютерах общего назначения байт равен 8 битам. Для того, чтобы подчеркнуть, что имеется в виду восьмибитный байт, в описании сетевых протоколов используется термин «октет» (англ. octet).

Иногда байтом называют последовательность битов, которые составляют подполе слова. На некоторых компьютерах возможна адресация байтов разной длины. Это предусмотрено инструкциями извлечения полей ассемблеров LDB и DPB на PDP-10 и в языке Common Lisp.

В IBM-1401 байт был равен 6 битам так же, как и в Минск-32, а в БЭСМ — 7 битам, в некоторых моделях ЭВМ производства Burroughs Computer Corporation (ныне — Unisys) — 9 битам. Во многих современных цифровых сигнальных процессорах используется байт длиной 16 бит и больше.

Название было впервые использовано в 1956 году В. Бухгольцем при проектировании первого суперкомпьютера IBM 7030 для пучка одновременно передаваемых в устройствах ввода-вывода битов (шести штук), позже в рамках того же проекта расширили байт до восьми (2 3 ) бит.

Кратные приставки для образования производных единиц для байта применяются не как обычно: во-первых, уменьшительные приставки не используются совсем, а единицы измерения информации меньшие чем байт называются специальными словами (ниббл и бит); во-вторых, увеличительные приставки означают за каждую тысячу 1024=2 10 (килобайт равен 1024 байтам, мегабайт равен 1024 килобайтам или 1 048 576 байтам, и т. д. с гигабайтами, терабайтами и петабайтами (больше пока не употребляются)). Разница возрастает с ростом веса приставки. Более правильно использовать двоичные приставки, но на практике они пока не применяются, возможно, из-за неблагозвучности — кибибайт, мебибайт и т. п.

Иногда десятичные приставки используются и в прямом смысле, например при указании ёмкости жёстких дисков: у них гигабайт может обозначать миллион кибибайт, т. е. 1 024 000 000 байт, а то и просто миллиард байт, а не 1 073 741 824 байт, как, например, в модулях памяти.

Килобайт (кбайт, кБ) м., скл. — единица измерения количества информации, равная (2 10 ) стандартным (8-битным) байтам или 1024 байтам. Применяется для указания объёма памяти в различных электронных устройствах.

Название «килобайт» общепринято, но формально неверно, так как приставка кило -, означает умножение на 1 000, а не 1 024. Правильной для 2 10 является двоичная приставка киби.

Таблица 1.2Кратные приставки для образования производных единиц

Измерения в байтах
Десятичная приставка Двоичная приставка
Название Символ Степень Название Символ Степень
килобайт kB 10 3 кибибайт KiB 2 10
мегабайт MB 10 6 мебибайт MiB 2 20
гигабайт GB 10 9 гибибайт GiB 2 30
терабайт TB 10 12 тебибайт TiB 2 40
петабайт PB 10 15 пебибайт PiB 2 50
экзабайт EB 10 18 эксбибайт EiB 2 60
зеттабайт ZB 10 21 зебибайт ZiB 2 70
йоттабайт YB 10 24 йобибайт YiB 2 80

Мегабайт (Мбайт, М) м., скл. — единица измерения количества информации, равная 1048576 (2 20 ) стандартным (8-битным) байтам или 1024 килобайтам. Применяется для указания объёма памяти в различных электронных устройствах.

Название «Мегабайт» общепринято, но формально неверно, так как приставка мега, означает умножение на 1 000 000, а не 1 048 576. Правильной для 2 20 является двоичная приставка меби. Сложившимся положением пользуются крупные корпорации, производящие жёсткие диски, которые при маркировке своих изделий под мегабайтом понимают 1 000 000 байт, а под гигабайтом — 1 000 000 000 байт.

Самую оригинальную трактовку термина мегабайт используют производители компьютерных дискет, которые понимают под ним 1 024 000 байта. Таким образом, дискета, на которой указан объём 1,44 Мбайт на самом деле вмещает лишь 1440 Кбайт, то есть 1,41 Мбайт в обычном понимании.

В связи с этим получилось, что мегабайт бывает коротким, средним и длинным:

короткий — 1 000 000 байт

средний — 1 024 000 байт

длинный — 1 048 576 байт

Гигабайт — кратная единица измерения количества информации, равная 1 073 741 824 (2 30 ) стандартным (8-битным) байтам или 1 024 мегабайтам.

Приставка СИ гига используется ошибочно, так как она обозначает умножение на 10 9 . Для 2 30 же следует употреблять двоичную приставку гиби-. Сложившимся положением пользуются крупные корпорации, производящие жёсткие диски, которые при маркировке своих изделий под мегабайтом понимают 1 000 000 байт, а под гигабайтом — 1 000 000 000 байт

Машинное слово— машинно-зависимая и платформозависимая величина, измеряемая в битах или байтах, равная разрядности регистров процессора и/или разрядности шины данных (обычно некоторая степень двойки). Размер слова совпадает, также, с минимальным размером адресуемой информации (разрядностью данных, расположенных по одному адресу). Машинное слово определяет следующие характеристики машины:

разрядность данных, обрабатываемых процессором;

разрядность адресуемых данных (разрядность шины данных);

максимальное значение беззнакового целого типа, напрямую поддерживаемого процессором: если результат арифметической операции превосходит это значение, то происходит переполнение;

максимальный объём оперативной памяти, напрямую адресуемой процессором.

Максимальное значение слова длинной n бит можно легко рассчитать по формуле 2 n −1

Таблица 1.3 — Размер машинного слова на различных платформах

studopedia.org — Студопедия.Орг — 2014-2022 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.016 с) .

Какие единицы используются для измерения объема информации, хранящейся на компьютере

Какие единицы используются для измерения объема информации, хранящейся на компьютере?

Единицы измерения информации, которые используются для измерения объема информации, хранящейся на компьютере.

1 байт = 8 бит
1 Кбайт (килобайт) = 2 10 байт
1 Мбайт (мегабайт) = 2 10 Кбайт = 2 20 байт
1 Гбайт (гигабайт) = 2 10 Мбайт = 2 20 Кбайт = 2 30 байт
1 Тбайт (терабайт) = 2 10 Гбайт = 2 20 Мбайт = 2 30 Кбайт = 2 40 байт

Есть еще одна единица, но она очень большая.

1 Пбайт (петабайт) = 2 10 Тбайт = 2 20 Гбайт = 2 30 Мбайт = 2 40 Кбайт = 2 50 байт

Единицы измерения информации

Все, что записано на компьютере, является информацией. Но информацию нужно в чем-то измерять, иначе с ней будет невозможно работать, правильно? Поэтому давайте разберемся с единицами ее измерения.

Для простоты будем считать, что наименьшая, необходимая нам (подчеркиваю) единица измерения информации называется байтом. Один байт — это один символ, который может собой представлять букву, цифру или некий специальный значок. Определение довольно грубое, но так вам будет понятнее.

На самом деле минимальная единица информации на компьютере — это бит. Он состоит из нуля или единицы. Компьютер вообще на так называемом машинном уровне оперирует только нулями и единицами, так как производит все вычисления в двоичной системе. Восемь бит составляют один байт, который, как мы уже выяснили, может обозначать какой-то символ. Кроме двоичной в компьютере используются еще восьмеричная или шестнадцатеричная системы счисления (кстати, учителя информатики любят мучить учеников зубодробительными примерами и задачками перевода чисел из одной системы в другую), но вы заплатили за учебник деньги, поэтому я избавлю вас от необходимости заниматься этой ерундой, которая на современном этапе развития программного обеспечения обычному пользователю совершенно не нужна.

Но так как даже обычный большой текст состоит из множества байтов, а общий объем информации на компьютере вмещает дикое количество байтов, то, как правило, для обозначения информации используют различные производные единицы. Это:

• килобайт (Кбайт, Кб) — 1024 байта;

• мегабайт (Мбайт, Мб) — 1024 килобайта;

• гигабайт (Гбайт, Гб) — 1024 мегабайта.

Почему в килобайте 1024 байта, а не ровно 1000, что казалось бы логичным, если следовать аналогиям с другими производными единицами? Это связано с компьютерным представлением информации. Килобайт— это два в десятой степени байта — то есть 1024 байта, а не 1000.

ГЛАВА 1 • Краткий ликбез

По этому поводу даже бытует распространенный анекдот: пользователь считает, что в килобайте ровно 1000 байт, а программист уверен, что в километре ровно 1024 метра.

Впрочем, пользователи обычно не берут в голову подобные тонкости, поэтому считают, что в килобайте 1000 байт, в мегабайте 1000 килобайт, а в гигабайте 1000 мега-1гг. И действительно, расхождение при этом получается не такое уж и большое, и и списывают его на погрешность вычислений. Им так удобнее. Имеют право.

Один мой знакомый измерял артистическое вдохновение граммами. Тоже имел право. Трехсотграммовый Гамлет у него был фееричный. Правда, семисотграммового вдохновения хватало только на Овода. И то — на сцену его расстрела. Впрочем, я что-то отвлекся.

Короче говоря, для простоты можно считать, что один байт — это один символ

бква, цифра). Один килобайт — 1024 байта, то есть 1024 символа. Что такое 1024

символа? Примерно половина машинописной страницы текста (если говорить

очно, то машинописная страница — это 1,8 Кб). То есть мегабайт (1024 Кб) — это

примерно 500 машинописных страниц с текстом. Представьте себе пачку бумаги в

500 страниц, отпечатанных с одной стороны, — это и будет мегабайт.

500 машинописных страниц — это книжка средних размеров (страниц в 300). Таким образом, один мегабайт — это одна книжка (с точки зрения количества символов чистого текста).

Средняя емкость современных жестких дисков (к моменту выхода учебника она, разумеется, уже увеличится) — порядка 200 Гб (один гигабайт, напоминаю, — это 1024 Мб). То есть на один винчестер, если говорить очень и очень условно, поместится примерно двести тысяч книг среднего размера. Обсчитаться можно, не так ли?

Впрочем, все эти данные приведены только для наглядности. На самом деле чистый текст на компьютере практически никогда не хранится. А если измерять всякие картинки, музыкальные файлы и так далее книжками среднего размера, то выяснится, что, например, одна картинка может занимать емкость, равную трем-пяти книгам.

Конспект главы «Краткий ликбез»

1. Компьютер — это электронно-вычислительная машина, способная хранить и обрабатывать информацию, а также формировать и передавать различные команды внешним устройствам.

2. Фирма IBM первая провозгласила принцип «открытой архитектуры», в результате чего IBM-совместимые компьютеры стали выпускать все кому не лень, и разработки других фирм популярностью не пользовались (за исключением компьютеров фирмы Apple).

3. Современные бытовые компьютеры делятся натри основные категории: настольные компьютеры, переносные (ноутбуки, лаптопы) и наладонные, или карманные, компьютеры.

Единицы измерения информации

4. Информация на компьютере измеряется в байтах. Для простоты можно считать, что один байт — это один символ (цифра, буква).

5. В байтах большие объемы указывать неудобно, поэтому обычно применяются всякие производные единицы измерений: килобайты (1024 байт), мегабайты (1024 килобайт) и гигабайты (1024 мегабайт).

6. Одна машинописная страница текста — примерно 1800 байт, или 1,8 килобайт. Емкость современных жестких дисков давно уже перевалили за 500 Гб.

Ответы на часто задаваемые вопросы

Куда делись старые типы домашних компьютеров — все эти Commodore, Olivetti, Spectrum ?

Были выброшены на свалку истории. Персональные компьютеры их задавили. Домашние компьютеры оказались тупиковой ветвью цивилизации. Кстати, в свое время фирма Commodore выпускала персональный компьютер Commodore Amigo. И компьютер, что интересно, был вполне неплохой (например, по качеству графики он заметно превосходил IBM-совместимые машины). Но он не смог выдержать конкуренции с принципом «открытой архитектуры». А вот компьютер фирмы Apple смог. Однако рассказ о том, почему у Apple это получилось, выходит за рамки данного пособия.

Оцените статью
Fobosworld.ru
Добавить комментарий

Adblock
detector