Урок 5
Измерение информации (алфавитный подход). Единицы измерения информации
— Алфавит, мощность алфавита.
— 1 бит – информационный вес символа двоичного алфавита.
— N=2b – формула для определения информационного веса символа.
— Информационный объём текста
— Единицы измерения информации: байт, килобайт, мегабайт, гигабайт.
Материал для углубленного изучения темы «Измерение информации»
Изучаемые вопросы:
— Содержательный подход к измерению информации
— Неопределенность знаний
— Формула Хартли
1.6.2. Информационный вес символа произвольного алфавита
Ранее мы выяснили, что алфавит любого естественного или формального языка можно заменить двоичным алфавитом. При этом мощность исходного алфавита N связана с разрядностью двоичного кода i, требуемой для кодирования всех символов исходного алфавита, соотношением: N = 2 i .
Разрядность двоичного кода принято считать информационным весом символа алфавита. Информационный вес символа алфавита выражается в битах.
Информационный вес символа алфавита i и мощность алфавита N связаны между собой соотношением: N = 2 i .
Задача 1. Алфавит племени Пульти содержит 8 символов. Каков информационный вес символа этого алфавита?
Решение. Составим краткую запись условия задачи.
Известно соотношение, связывающее величины i и N : N = 2 i .
С учётом исходных данных: 8 = 2 i . Отсюда: i = 3.
Полная запись решения в тетради может выглядеть так:
1 килобайт = 1 Кб = 1024 байта
1 мегабайт = 1 Мб = 1024 Кб
1 гигабайт = 1 Гб = 1024 Гб
Книга содержит 150 страниц.
На каждой странице — 40 строк.
В каждой строке 60 символов (включая пробелы).
Найти информационный объем текста.
1. Количество символов в книге:
60 * 40 * 150 = 360 000 символов.
2. Т.к. 1 символ весит 1 байт, информационный объем книги равен
3. Переведем байты в более крупные единицы:
360 000 / 1024 = 351,56 Кб
351,56 / 1024 = 0,34 Мб
Продолжение поста «Microsoft купит Activision Blizzard: World of Warcraft, Diablo II, Overwatch, Starcraft, Warcraft III и другие игры уже в кармане»
Говорят скоро в игре World of Warcraft появится новый питомец:
Самое главное
При алфавитном подходе считается, что каждый символ некоторого сообщения имеет опредёленный информационный вес — несёт фиксированное количество информации.
1 бит — минимальная единица измерения информации.
Информационный вес i символа алфавита и мощность N алфавита связаны между собой соотношением: N = 2 i . Информационный объём I сообщения равен произведению количества К символов в сообщении на информационный вес i символа алфавита: I = K • i.
1 байт = 8 битов.
Байт, килобайт, мегабайт, гигабайт, терабайт — единицы измерения информации. Каждая следующая единица больше предыдущей в 1024 (2 10 ) раза.
Что такое байт
Байт (byte) — восемь последовательных битов образуют 1 байт. Это минимальный объем информации, к которому можно обратится напрямую и с которым имеют дело компьютерные программы. В современной компьютерной технике 1 байт равен 8 битам, но есть исключения, поэтому его еще иногда называют «октет» для полной однозначности. Теперь вы знаете, сколько бит в байте.
Именно в байтах измеряют объем любой информации неважно текст, изображение и видео. Поэтому в Проводник показывает вес (объем) файла в байтах, о существовании битов обычные пользователи компьютера могут даже не догадываться. Объем накопителей для хранения данных так же выражается в байтах.
В школе изучают эти приставки и все знают, что приставка «кило» означает тысяча (10 3 ), например километр (1 000 метров), килограмм (1 000 грамм). Приставка «мега» означает миллион (10 6 ), например мегагерц (1 000 000 герц), мегаом (1 000 000 ом). Есть и многие другие широко распространенные в нашей жизни приставки. Именно в этот момент у изучающих компьютер начинается путаница. Дело в том, что в компьютерах используют те же приставки, то есть килобайт, мегабайт, гигабайт и так далее, но они кратны 1 024 (2 10 ). Согласитесь, неожиданный поворот. На эту тему есть даже древний анекдот:
— В чем отличие программиста от простого человека?
— Программист думает, килограмм картошки — это 1 024 грамма, а простой человек полагает, что в килобайте 1 000 байт.
На самом деле, для обозначения единиц компьютерной информации существуют свои собственные приставки, которые устраняют эту чехарду, правда ими практически никто не пользуется. Считается, что в силу их громоздкости и труднопроизносимости. Образуются заменой последнего слога стандартной приставки на «би», кибибайт, мебибайт, гибибайт, тебибайт и так далее.
Килобайт (КБ, Кбайт) — единица информации равная 1 024 байтам . Хотя правильнее как уже говорилось выше, называть ее кибибайтом. Чтобы перевести килобайты в байты, их нужно умножить на 1 024 , а чтобы получились биты, умножить получившееся число еще на 8. В итоге, в 1 КБ содержит 8 192 бита .
Мегабайт (МБ, Мбайт) — единица информации равная 1 024 килобайта . Чтобы перевести байты в мегабайты их нужно разделить на 1 024 и еще раз на 1 024 , то есть он равен 1 048 576 байтам . Обычно вес музыки, фотографий или коротких видеоклипов измеряется как раз в них.
Гигабайт (ГБ, Гбайт) — единица информации равная 1 024 мегабайта , 1 048 576 килобайт , 1 073 741 824 байтам или 8 589 934 592 бит . В основном это фильмы в хорошем качестве. Высчитывать все это вручную не очень удобно, поэтому ниже есть специальный конвертер для пересчета единиц измерения объема информации.
Терабайт (ТБ, Тбайт) — самая большая единица объема информации, с которой может столкнуться обычный пользователь компьютера на сегодняшний день и то не в виде отдельных файлов, а в виде объема жесткого диска. Равен 1 024 гигабайтам или 1 048 576 мегабайтам . С другой стороны, объем потребляемой информации постоянно растет и в будущем терабайт может стать такой же привычной величиной и повсеместное внедрение видео формата 4K вполне может этому поспособствовать.
Это самые распространенные на сегодняшний день объемы отдельных файлов встречающиеся в компьютерах обычных пользователей. Остальные единицы измерения информации, такие как терабайт, петабайт, эксабайт и так далее пока не встречаются в домашних компьютерах, за исключением терабайта. Вы можете посмотреть в таблице, а так же воспользоваться онлайн калькулятором расположенным ниже для их пересчета.
Общеупотребительные | Приставки МЭК | |||
---|---|---|---|---|
Название | Сокращение | Название | Сокращение | Степень |
байт | Б (байт) | байт | Б | 2 0 |
килобайт | КБ (Кбайт) | кибибайт | КиБ | 2 10 |
мегабайт | МБ (Мбайт) | мебибайт | МиБ | 2 20 |
гигабайт | ГБ (Гбайт) | гибибайт | ГиБ | 2 30 |
терабайт | ТБ (Тбайт) | тебибайт | ТиБ | 2 40 |
петабайт | ПБ (Пбайт) | пебибайт | ПиБ | 2 50 |
эксабайт | ЭБ (Эбайт) | эксбибайт | ЭиБ | 2 60 |
зеттабайт | ЗБ (Збайт) | зебибайт | ЗиБ | 2 70 |
йоттабайт | ЙБ (Йбайт) | йобибайт | ЙиБ | 2 80 |
Разобрались, что такое килобайт, мегабайт, гигабайт и так далее? Хорошо, однако, это еще не вся путаница, которая подстерегает чайника в компьютерах. Все еще интереснее и веселее.
Таблица байтов:
1 Кб (1 Килобайт) = 2 10 байт = 2*2*2*2*2*2*2*2*2*2 байт =
= 1024 байт (примерно 1 тысяча байт – 10 3 байт)
1 Мб (1 Мегабайт) = 2 20 байт = 1024 килобайт (примерно 1 миллион байт – 10 6 байт)
1 Гб (1 Гигабайт) = 2 30 байт = 1024 мегабайт (примерно 1 миллиард байт – 10 9 байт)
1 Тб (1 Терабайт) = 2 40 байт = 1024 гигабайт (примерно 10 12 байт). Терабайт иногда называют тонна.
1 Пб (1 Петабайт) = 2 50 байт = 1024 терабайт (примерно 10 15 байт).
1 Эксабайт = 2 60 байт = 1024 петабайт (примерно 10 18 байт).
1 Зеттабайт = 2 70 байт = 1024 эксабайт (примерно 10 21 байт).
1 Йоттабайт = 2 80 байт = 1024 зеттабайт (примерно 10 24 байт).
В приведенной выше таблице степени двойки (2 10 , 2 20 , 2 30 и т.д.) являются точными значениями килобайт, мегабайт, гигабайт. А вот степени числа 10 (точнее, 10 3 , 10 6 , 10 9 и т.п.) будут уже приблизительными значениями, округленными в сторону уменьшения. Таким образом, 2 10 = 1024 байта представляет точное значение килобайта, а 10 3 = 1000 байт является приблизительным значением килобайта.
Такое приближение (или округление) вполне допустимо и является общепринятым.
Ниже приводится таблица байтов с английскими сокращениями (в левой колонке):
1 Kb ~ 10 3 b = 10*10*10 b= 1000 b – килобайт
1 Mb ~ 10 6 b = 10*10*10*10*10*10 b = 1 000 000 b – мегабайт
1 Gb ~ 10 9 b – гигабайт
1 Tb ~ 10 12 b – терабайт
1 Pb ~ 10 15 b – петабайт
1 Eb ~ 10 18 b – эксабайт
1 Zb ~ 10 21 b – зеттабайт
1 Yb ~ 10 24 b – йоттабайт
Выше в правой колонке приведены так называемые «десятичные приставки», которые используются не только с байтами, но и в других областях человеческой деятельности. Например, приставка «кило» в слове «килобайт» означает тысячу байт. В случае с километром она соответствует тысяче метров, а в примере с килограммом она равна тысяче грамм.
Продолжение следует…
Возникает вопрос: есть ли продолжение у таблицы байтов? В математике есть понятие бесконечности, которое обозначается как перевернутая восьмерка: ∞.
Понятно, что в таблице байтов можно и дальше добавлять нули, а точнее, степени к числу 10 таким образом: 10 27 , 10 30 , 10 33 и так до бесконечности. Но зачем это надо? В принципе, пока хватает терабайт и петабайт. В будущем, возможно, уже мало будет и йоттабайта.
Напоследок парочка примеров по устройствам, на которые можно записать терабайты и гигабайты информации.
Есть удобный «терабайтник» – внешний жесткий диск, который подключается через порт USB к компьютеру. На него можно записать терабайт информации. Особенно удобно для ноутбуков (где смена жесткого диска бывает проблематична) и для резервного копирования информации. Лучше заранее делать резервные копии информации, а не после того, как все пропало.
Флешки бывают 1 Гб, 2 Гб, 4 Гб, 8 Гб, 16 Гб, 32 Гб , 64 Гб и даже 1 терабайт.
CD-диски могут вмещать 650 Мб, 700 Мб, 800 Мб и 900 Мб.
DVD-диски рассчитаны на большее количество информации: 4.7 Гб, 8.5 Гб, 9.4 Гб и 17 Гб.
Примеры расчета мощности и объема
Сколько символов можно закодировать 3 битами?
1 символ равен 8 битам, поэтому закодировать целые символы не получится. Можно провести кодировку трехбитовых комбинаций. Тогда расчет необходимо производить по формуле Хартли: N=2 i , где i=3. 2 3 =8
Приняв информационный вес символа за байт, требуется рассчитать объем информации напечатанного сообщения:
«Белеет парус одинокий
В тумане моря голубом»
В приведенных двух строчках насчитывается 43 инициала (пробелы считаются, но скобки не учитываются), тогда информационный объем вычисляется по формуле, которая приведен ниже: