403 ERROR

Измерение информации

В информатике в основном измеряют информацию, которая представлена дискретным сигналом. При этом различают следующие подходы: структурный, статистический и семантический [43].

Структурный метод предполагает измерение количества информации элементарным подсчетом количества информационных элементов, которые составляют сообщение. Данный метод используется для определения объемов передаваемых сообщений, возможностей запоминающих ус тройс тв и др.

Структурный метод включает три меры измерения информации: геометрическую, комбинаторную и аддитивную, или меру Хартли.

Геометрическая мера. При помощи данной меры можно вычислить потенциальное количество информации в определенных объемах. В качестве единицы измерения используется определенный информационный элемент. Например, для измерения емкости запоминающего устройства в качестве информационного элемента принимается минимальная единица — бит. Более крупные единицы хранения информации, производные от минимальной имеют следующий вид:

  • 8 бит = 1 байт (1 Б);
  • 1024 Б = 1 килобайт (1 КБ);
  • 1024 КБ = 1 мегабайт (1 МБ);
  • 1024 МБ = 1 гигабайт (1 ГБ).

Недостатком такой меры измерения информации является ее нечувствительность к символам и их алфавиту. Например, равными но количеству информации, измеренной геометрической мерой, являются сообщения «код» и «бит», а также 46 и 10.

Комбинаторная мера. При помощи данной меры можно вычисли ть возможность представления информации при помощи различных комбинаций информационных элементов данного алфавита в заданном объеме. Данная мера использует возможные комбинации элементов и надлежащие математические соотношения, которые изучаются в одном из разделов дискретной математики — комбинаторике [38].

Комбинаторная мера применяется для вычисления информационных возможностей определенного цифрового автомата, который способен создавать дискретные сигналы (сообщения) в соответствии с правилом комбинаторики.

Комбинаторная мера в сравнении с геометрической мерой учитывает объем исходного алфавита и правила, по которым из его символов строятся сообщения. Данная мера широко применяется для вычисления возможностей кодирующих систем.

Аддитивная мера, или мера Хартли. Оценивает количество информации в зависимости от длины сообщения и мощности исходного алфавита. Единицей измерения информации в аддитивной мере является бит. Данная мера измерения информации устанавливает логарифмическую зависимость между количеством информации и мощностью исходного алфавита:

1 = 1 log2 И,

где I — количество информации, содержащейся в сообщении;

I — длина сообщения;

h — мощность исходного алфавита.

Например, емкость одного разряда для двоичного алфавита будет равна l=l*log22 = 1. Таким образом, количество информации, которое содержится в одной двоичной цифре, равно 1 бит, что и является единицей измерения.


Файл. Форматы файлов

Файл – наименьшая единица хранения информации, содержащая последовательность байтов и имеющая уникальное имя.

Группы файлов на диске образуют каталоги и подкаталоги. «Главный» каталог, который не входит ни в один другой, называется корневым.

Каждый файл имеет адрес, имя и расширение имени. Пример: C:My Documents Отчет.doc. Расширения указывают на тип хранящейся информации.

Для измерения количества информации и емкости запоминающих устройств компьютера используются единицы

2. Единицы измерения данных

Объем данных (V) – количество байт, которое требуется для их хранения в памяти электронного носителя информации.

Память носителей в свою очередь имеет ограниченную ёмкость, т.е. способность вместить в себе определенный объем.

· Бит — базовая единица измерения количества информации , равная количеству информации, содержащемуся в опыте, имеющем два равновероятных исхода. Это тождественно количеству информации в ответе на вопрос, допускающий ответы «да» либо «нет» и никакого другого (то есть такое количество информации, которое позволяет однозначно ответить на поставленный вопрос). Один разряд двоичного кода (двоичная цифра). Может принимать только два взаимоисключающих значения: да/нет, 1/0, включено /выключено, и т. п. В электронике 1 двоичному разряду соответствует 1 двоичный триггер, который имеет два устойчивых состояния.

· Байт (англ. byte ) — единица хранения и обработки цифровой информации. В настольных вычислительных системах байт считается равным восьми битам, в этом случае он может принимать одно из 256 (2 8 ) различных значений. Следует понимать, что количество бит в байте не является однозначной величиной и может варьироваться в широком диапазоне. Так, в первых компьютерах размер байта был равен 6 битам. В суперкомпьютерах, вследствие используемой адресации, один байт содержит 32 бита. Для того , чтобы подчеркнуть, что имеется в виду восьмибитный байт, а также во избежание широко распростанённого заблуждения, что в одном байте исключительно восемь бит, в описании сетевых протоколов используется термин «октет» (лат. octet ). Байт в современных x86-совместимых компьютерах — это минимально адресуемый набор фиксированного числа битов.

· Килоба́йт ( кБ , Кбайт, КБ) м., скл . — единица измерения количества информации, равная в зависимости от контекста 1000 или 1024 (2 10 ) стандартным (8-битным) байтам. Применяется для указания объёма памяти в различных электронных устройствах.

1 килобайт (КБ) = 8 килобит (Кб)

Название «килобайт» часто применяется для 1024 байт, но формально неверно, так как приставка кил о- , традиционно означает умножение на 1000, а не 1024. Согласно предложению МЭК, формально правильной (хотя и относительно редко используемой) для 2 10 является двоичная приставка киби .

Исторически сложилось, что со словом «байт» несколько некорректно (вместо 1000 = 10 3 принято 1024 = 2 10 ) использовали и продолжают использовать приставки СИ: 1 Кбайт = 1024 байт, 1 Мбайт = 1024 Кбайт, 1 Гбайт = 1024 Мбайт и т. д. При этом обозначение Кбайт начинают с прописной буквы в отличие от строчной буквы «к» для обозначения множителя 10 3 .

· Мегаба́йт (Мбайт, М, МБ) м., скл . — единица измерения количества информации, равная, в зависимости от контекста, 1 000 000 (10 6 ) или 1 048 576 (2 20 ) стандартным (8-битным) байтам. Сокращенное название МБ отличается от Мегабита (Мб) строчной буквой (но на самом деле иногда происходит некоторая путаница в сокращениях). Применяется для указания объёма памяти в различных электронных устройствах.

· Гигабайт (Гбайт, Г, ГБ) — кратная единица измерения количества информации, равная 10 9 стандартным (8-битным) байтам или 1 000 000 000 байтам. Применяется для указания объёма памяти в различных электронных устройствах. От сложившегося положения нередко страдают потребители продукции крупных корпораций, производящих жёсткие диски и карты флэш-памяти . Приобретая изделие, в маркировке которого указана его реальная емкость, например, 1 гигабайт или 1 000 000 000 байт они полагают, что приобретают изделие емкостью 1 гибибайт или 1 073 741 824 байт, что нередко приводит к непониманию и недовольству.

Бай т- мельчайшая адресуемая единица информации

Килобайт – базовая единица

Машинное слово — машиннозависимая и платформозависимая величина, измеряемая в битах или байтах , равная разрядности регистров процессора и/или разрядности шины данных . На ранних компьютерах размер слова совпадал также с минимальным размером адресуемой информации (разрядностью данных, расположенных по одному адресу); на современных компьютерах минимальным адресуемым блоком информации обычно является байт, а слово состоит из нескольких байтов. Машинное слово определяет следующие характеристики аппаратной платформы :

· разрядность данных , обрабатываемых процессором;

· разрядность адресуемых данных (разрядность шины данных);

· максимальное значение беззнакового целого типа , напрямую поддерживаемого процессором: если результат арифметической операции превосходит это значение, то происходит переполнение ;

· максимальный объём оперативной памяти , напрямую адресуемой процессором.

Кластер — в некоторых типах файловых систем логическая единица хранения данных в таблице размещения файлов, объединяющая группу секторов. Как правило, это наименьшее место на диске, которое может быть выделено для хранения файла.

Се́ктор диска — минимальная адресуемая единица хранения информации на дисковых запоминающих устройствах. Является частью дорожки диска. У большинства устройств размер сектора составляет 512 байт, либо 2048 байт (например, у оптических дисков).

Для более эффективного использования места на диске файловая система может объединять секторы в кластеры, размером от 512 байт (один сектор) до 64 кбайт (128 секторов). Переход к кластерам произошел потому, что размер таблицы FAT был ограничен, а размер диска увеличивался. Количество секторов на цилиндрах ранее было одинаковым, на современных дисках количество секторов на цилиндр разное, но контроллер жёсткого диска сообщает о некоем условном количестве дорожек, секторов и сторон, хотя позднее была создана система обращения к дискам, в которой все секторы пронумерованы. Первый сектор диска обычно является загрузочным.

Алфавитный (объёмный) подход к измерению информации

С помощью алфавитного подхода можно определять количество информации в текстовом сообщении, которое состоит из символов определённого алфавита.

Алфавит — это набор символов, которые используются в некотором языке с целью представления информации.

Например, мощность алфавита, состоящего из (26) латинских букв и дополнительных символов (скобки, пробел, знаки препинания ((11) шт.), (10) цифр), — (47).

определи информационный объём сообщения (в Кбайтах), состоящего из 8192 символов, если используется алфавит из 256 символов.

1. определим, какое количество бит необходимо для кодировки одного символа. Так как мощность используемого алфавита (N)(=) 256 , то (i) (=) 8 (использовали формулу N = 2 i ).

2. Вычислим информационный объём сообщения, которое состоит из 8192 символов, используя формулу I = K · i :

Любая компьютерная техника работает в двоичном коде, понимая только значения (0) — «сигнал есть» и (1) — «сигнала нет». Эти значения хранятся в бите — наименьшей единице измерения информации. Однако удобнее использовать более крупные единицы измерения информации, которые приведены в таблице.

(1) байт (8) бит (=) 2 3 бит
(1) Кбайт (килобайт) 2 10 байт
(1) Мбайт (мегабайт) 2 10 Кбайт
(1) Гбайт (гигабайт) 2 10 Мбайт
(1) Тбайт (терабайт) 2 10 Гбайт

1) определить, сколько Мбайт информации содержится в (512) битах. Ответ дай в виде степени числа (2).

Эксабайты («ЭБ»)

И значение единицы измерения цифрового объема информации из ближайшего будущего – это эксабайт, который, как логично утверждать, состоит из «1024 петабайтов». Мировые технические гиганты, такие как «Amazon», «Google» и «Facebook» (которые обрабатывают немыслимые объемы данных), как правило, единственные, кто беспокоится о подобном виде хранилища прямо сейчас. На потребительском уровне, некоторые (но не все) файловые системы, используемые операционными системами в настоящее время, имеют теоретический предел где-то в эксабайтах.

Реальные примеры хранения цифрового массива информации в эксабайтах («ЭБ»):

«1 ЭБ» = Одиннадцать миллионов видео в стандарте высокого разрешения «4К».

«5 ЭБ» = Включает все слова, произнесенные человечеством.

«15 ЭБ» = Общие расчетные данные, проведенные «Google».

Конечно, этот список можно продолжать. Следующие три возможных значения в списке единиц измерения объема цифровой информации (для тех, кому это интересно) – это зеттабайт, йоттабайт и бронтобайт. Но, честно говоря, используя эксабайты, вы получите астрономические возможности для хранения разнообразной информации, которые сейчас, практически, не имеют реального применения.

Теперь, зная основные единицы измерения цифровой информации и возможный объем хранимых данных для каждой из них, вы легко сможете определиться, в многообразии устройств для хранения, и выбрать наиболее подходящее для вас.

Полную версию статьи со всеми дополнительными видео уроками читайте в нашем блоге.

Данный материал является частной записью члена сообщества Club.CNews.
Редакция CNews не несет ответственности за его содержание.

Оцените статью
Fobosworld.ru
Добавить комментарий

Adblock
detector