Методы измерения количества информации
Информация (лат. informatio — разъяснение, изложение, набор сведений) — базовое понятие в информатике, которому нельзя дать строгого определения, а можно только пояснить:
- информация — это новые факты, новые знания;
- информация — это сведения об объектах и явлениях окружающей среды, которые повышают уровень осведомленности человека;
- информация — это сведения об объектах и явлениях окружающей среды, которые уменьшают степень неопределенности знаний об этих объектах или явлениях при принятии определенных решений.
Понятие «информация» является общенаучным, т. е. используется в различных науках: физике, биологии, кибернетике, информатике и др. При этом в каждой науке данное понятие связано с различными системами понятий. Так, в физике информация рассматривается как антиэнтропия (мера упорядоченности и сложности системы). В биологии понятие «информация» связывается с целесообразным поведением живых организмов, а также с исследованиями механизмов наследственности. В кибернетике понятие «информация» связано с процессами управления в сложных системах.
Основными социально значимыми свойствами информации являются:
- полезность;
- доступность (понятность);
- актуальность;
- полнота;
- достоверность;
- адекватность.
В человеческом обществе непрерывно протекают информационные процессы: люди воспринимают информацию из окружающего мира с помощью органов чувств, осмысливают ее и принимают определенные решения, которые, воплощаясь в реальные действия, воздействуют на окружающий мир.
Информационный процесс — это процесс сбора (приема), передачи (обмена), хранения, обработки (преобразования) информации.
Сбор информации — это процесс поиска и отбора необходимых сообщений из разных источников (работа со специальной литературой, справочниками; проведение экспериментов; наблюдения; опрос, анкетирование; поиск в информационно-справочных сетях и системах и т. д.).
Передача информации — это процесс перемещения сообщений от источника к приемнику по каналу передачи. Информация передается в форме сигналов — звуковых, световых, ультразвуковых, электрических, текстовых, графических и др. Каналами передачи могут быть воздушное пространство, электрические и оптоволоконные кабели, отдельные люди, нервные клетки человека и т. д.
Хранение информации — это процесс фиксирования сообщений на материальном носителе. Сейчас для хранения информации используются бумага, деревянные, тканевые, металлические и другие поверхности, кино- и фотопленки, магнитные ленты, магнитные и лазерные диски, флэш-карты и др.
Обработка информации — это процесс получения новых сообщений из имеющихся. Обработка информации является одним из основных способов увеличения ее количества. В результате обработки из сообщения одного вида можно получить сообщения других видов.
Защита информации — это процесс создания условий, которые не допускают случайной потери, повреждения, изменения информации или несанкционированного доступа к ней. Способами защиты информации являются создание ее резервных копий, хранение в защищенном помещении, предоставление пользователям соответствующих прав доступа к информации, шифрование сообщений и др.
Наименьшая единица измерения информации
Для измерения информации в информатике используют свою, особенную единицу измерения. Она получила название — «бит» и образована от словосочетания двух английских слов — «binary digit».
Для того чтобы была возможность измерить информацию необходимо, как вы помните, закодировать информацию в цифровые двоичные данные. Только так, мы сможем узнать размер набора цифровых данных, хранящемся в каком-либо файле.
Бит — наименьшая единица измерения информации.
Это определение означает, что не существует никакой другой единицы измерения информации, которая была бы меньше, по своему значению, чем один бит.
Один бит содержит в себе очень малую часть информации. Ведь он способен принимать только одно из двух определенных значений (1 или 0).
Поэтому, измерять информацию, используя лишь одни биты, крайне неудобно — числа выходят очень большими. Это тоже самое, если бы мы измеряли высоту своего тела в миллиметрах.
Например, для кодирования 1 символа в текст достаточно 8 бит. 8 бит называют байтом.
Немного
Как я уже говорил, компьютеры состоят из сигнальных проводов, и этот сигнал может быть включен или выключен. Это включенное или выключенное состояние провода называется битом . Этот бит – самая маленькая часть информации, которую может хранить компьютер. Если у вас есть больше проводов, вы получите больше 1 и 0 с большим количеством битов. И еще биты могут быть использованы для представления сложной информации.
Здесь важно то, что любое число может быть представлено единицами и нулями или связкой проводов и транзисторов, которые включены или выключены. Чем больше проводов или транзисторов, тем большее количество вы можете хранить. Предположим, вы хотите хранить информацию, такую как текст, изображения или звук, все они могут быть представлены числами. Эти цифры могут быть сохранены как вкл или выкл электрических сигналов.
Двоичное число может быть 0 или 1, что означает, что переключатель выключен или включен соответственно. Это состояние включения или выключения переключателя называется бит. Байт – это набор битов, а один байт состоит из восьми двоичных цифр. Биты сгруппированы в восемь двоичных разрядов, потому что большинство микросхем памяти имеют электронную схему из восьми путей, причем каждый путь имеет либо состояние «включено», либо выключено. Байт может представлять 2 ^ 8 (256) различных значений, т. Е. 0,1 байт может представлять значения от нуля (00000000) до 255 (11111111).
Единицы измерения информации в порядке возрастания
Для того чтобы комфортно работать с данными и информацией, необходимо оперировать всеми представленными единицами измерения. Всегда наименьшая единица измерения информации – это основа, именно от нее отталкиваются во время конвертации к большему значению. Расположив все единицы информации по возрастанию, мы получим такой результат:
- 1 бит – наименьшая единица информации, обозначает 1 или 0 в двоичном коде.
- 1 байт – содержит в себе 8 бит.
- 1 Кбайт – позволяет выразить единицей значение в 1024 байт.
- 1 Мбайт– содержит в себе 1024 Кбайт, или 1048576 байт.
- 1 Гбайт– позволяет свести к единице 1024 Гбайт, 1048576 Кбайт или 1073741824 байт.
- 1 Тбайт – равен 1024 Гбайт, 1048576 Мбайт, 1073741824 Кбайт или 1099511627776 байт.
Это основные данные для проведения расчетов в информационном пространстве. Все единицы измерения информации в информатике могут быть конвертированы в обоих направлениях, от большего к меньшему, и наоборот.
Самой большой единицей измерения информации является значение 10 в 24 степени, называется оно йотта, или 1 йбайт. В данный момент это значение встречается очень редко, только лишь в глобальных расчетах. Но простые пользователи уже считают информацию в терабайтах, при этом количество ее только возрастает. Есть большая вероятность того, что вскоре носители перейдут на уровень петабайтов, в 1 Пбайте информации хранится 1024 Гбайт. Также в единицах измерения информации есть экса, зетта, которые идут после пбайта.
Производные от «байт»
Но исчислять информацию в БИТАХ неудобно, как правило, все применяют «БАЙТЫ». Чаще всего самой популярной единицей измерения количества информации на Вашем компьютере является мегабайт. Если Вы наведете мышкой на любую папку с достаточным количеством информации, то всплывет маленькое пояснительное окошко, где будет указан объем этой папки. Вот таблица перевода одних единиц в другие (жирным шрифтом выделено обозначение величины):
1 килобайт (КБ) = 1024 байт («2» в 10 степени байт)
1 мегабайт (МБ) = 1024 килобайт («2» в 10 степени килобайт)
1 гигабайт (ГБ) = 1024 мегабайт («2» в 10 степени мегабайт)
1 терабайт (ТБ) = 1024 гигабайт («2» в 10 степени гигабайт)
Как видно, все аналогично битам.
Систематические кратные
Термины для больших количеств битов могут быть сформированы с использованием стандартного диапазона префиксов SI для степеней 10, например, кило = 103 = 1000 (как в килобитах или кбитах), мега = 106 = 1 000 000 (как в мегабитах или Мбитах) и гига = 109 = 1 000 000 000 (как в гигабитах или Гбит). Эти префиксы чаще используются для кратных байтов, например, в килобайтах (1 кБ = 8000 бит), мегабайтах (1 МБ = 8000000 бит) и гигабайтах (1 ГБ = 8 000 000 000 бит).
По этой причине объемы памяти компьютера и некоторых модулей хранения часто кратны некоторой большой степени двух чисел, например 228 = 268 435 456 байт. Чтобы избежать таких громоздких чисел, люди часто переназначали префиксы SI для обозначения ближайшей степени двух, например, используя кило-префикс для 210 = 1024, мега — для 220 = 1 048 576 и гига — для 230 = 107 3741 824 и так далее. Например, чип памяти с произвольным доступом емкостью 228 байт будет называться чипом 256 мегабайт.
Производные величины
Единицы информации можно переводить, как сантиметры в метры. Сейчас для этих целей, в основном, используется метрическая система СИ и такие приставки, как Кило ( ( 10^3 ) ), Мега ( ( 10^6 ) ), Гига ( ( 10^9 ) ) и т.д. Однако используются они не как обычно. Так, например, 1 KByte содержит 1024 bytes, а в 1 MByte содержатся 1024 KBytes. Ниже Вы можете увидеть небольшую таблицу производных.
Что такое измерение информации
При измерении информации следует учитывать как объем передаваемого сообщения, так и его смысловую нагрузку. В связи с этим в информатике существуют разные подходы к измерению информации.
Способы оценки величины информации могут учитывать или не учитывать смысла информационного сообщения.
Один из способов нахождения количества информации основан на определении веса каждого символа в тексте сообщения. При таком подходе объем сообщения зависит от количества знаков в тексте, чем больше тест, тем больше весит информационное сообщение. При этом абсолютно не важно, что написано, какой смысл несет сообщение. Так как определение объема информации привязано к текстовым единицам: буквам, цифрам, знакам препинания, то такой подход к измерению информации получил название алфавитного.
Вес отдельного знака зависит от их количества в алфавите. Число символов алфавита называют мощностью (N). Например, мощность алфавита английского языка по числу символов равно 26, русского языка 33. Но на самом деле, при написании текста используются и прописные и строчные буквы, а также знаки препинания, пробелы и специальные невидимые символы, обозначающие конец абзаца и перевод к новой строке. Поэтому имеют дело с мощностью 128 или в расширенной версии 256 символов.
Рис. 1. Таблица символов – латиница.
Объем различных типов файлов
Уверен, многих интересует, как узнать, сколько же информации способен вместить именно Ваш компьютер, а точнее винчестер или жесткий диск. Кстати почитайте перед этим про локальные диски. Я Вас научу самому простому способу это сделать.
Откройте «Мой компьютер». Видите свои локальные диски? Единицы измерения информации, использующиеся для показа количества информации на локальных дисках у всех, как правило, одинаковы. Это гигабайты. Что такое гигабайт мы уже знаем, так что перейдем к подсчету свободного и занятого места на жестком диске. Под каждым диском есть специальное уведомление, где показано, сколько свободного места осталось и сколько всего информации диск может вместить.
Теперь приведу некоторые примеры файлов и их возможные объемы. Это поможет Вам ориентироваться в том, что Вы сможете записать на локальный диск, а что туда уже не влезет. Заметьте, один локальный диск НЕ МОЖЕТ задействовать место другого. Это значит, что файл целиком и полностью должен находиться на одном локальном диске. Есть, правда, специальные программы, позволяющие работать с локальными дисками, но об этом мы будем говорить в другой раз, так как тема сложная и достаточно объемная.
Кстати, различные типы файлов вы можете найти на своем рабочем столе.
Любите слушать музыку? Тогда Вам просто необходимо знать, что один музыкальный трек занимает до нескольких мегабайт объема памяти (в среднем, от 3 до 7). Попробуйте самостоятельно подсчитать, сколько таких мелодий вместит Ваш локальный диск, если на нем есть 1 гигабайт свободного места.
А как на счет того, чтобы посмотреть хороший фильм? Их объем, в зависимости от качества записи и длины трека, может занимать от 700 мегабайт до 1,5 гигабайта.
Для общего развития добавлю, что современные полноформатные игры могут занимать до нескольких десятков гигабайт. Не всякий локальный диск может выдержать такое.
Единицы измерения информации путать не стоит. Четко обращайте внимание на то, сколько места есть и сколько необходимо записать.
Современные жесткие диски могут содержать информацию объемом несколько терабайт. Что очень актуально, ведь качество игр, фильмов и даже музыки растет, что требует постоянного увеличения их информационного объема.
Теперь Вы знаете, что такое байты какие бывают производные от него. Вам известны рамки объема Ваших локальных дисков, а значит, Вы стали лучше понимать работу компьютера.