Файловая структура компьютера – что это такое и зачем используется
Ни один современный электронный накопитель не обходится без файловой системы. Это своего рода операционная система жесткого диска, позволяющая ему управлять потоками данных и хранить их в необходимых форматах. Многие пользователи также называют ее файловой структурой. Необходимо разобраться, что такое файловая система и файловая структура (ФС), в чем их отличия.
Файл – набор зависимой друг от друга информации, которая хранится рядом друг с другом на жестком диске на долговременной основе. Он может представлять собой программы или данные определенных расширений, которые читаются только ими. Если какая то часть этой информации повреждается, то другая целая информация может быть попросту бесполезна без утерянной. Наиболее частыми операциям над ними являются:
- копирование;
- удаление;
- редактирование;
- переименование;
- перемещение.
Пример иерархической ФС изображен на рисунке:
ФС – это набор предустановленных программ, предусмотренный на любом современном носителе информации. В ней может храниться большое количество элементов, но это не все ее функции, так как она определяет также способ их хранения.
Каждый винчестер разделяется на две области: хранение данных и каталог. Каталог представляет собой хранилище, в котором находятся имя файла и его местонахождение на диске. Сейчас наиболее популярными системами являются: FAT16, FAT32, NTFC, exFAT.
Что такое «Файловая структура»?
Файловая структура (ФС)– это то же самое, что и файловая система, но с учетом того что в первой все описания выполнены логически, а во второй – физически, а именно с точки зрения аппаратных средств и программирования. ФС – это функциональная часть операционной системы, которая отвечает за то, чтобы файлы, папки и любые другие данные хранились надежно и в определенной последовательности.
Видов логических структур существует несколько. Предназначены они для различных архитектур дисковых хранилищ. Среди них:
- Одноуровневая (линейная) – это обычая последовательность имен файлов. Часто она используется для небольших по объему дисков, на которых может располагаться совсем малое количество элементов. Доступ к информации на таких носителях осуществляется через простое обращение по имени, поскольку никаких вложенных папок, где могли находиться данные – нет.
- Многоуровневая (иерархическая) – многоуровневая последовательность папок и файлов. Используется на дисковых хранилищах, на которых хранятся сотни или тысячи элементов. Она имеет древовидное построение. Начальный или корневой каталог содержит вложенные каталоги первого уровня, которые в свою очередь могут содержать папки второго уровня и так далее. В каталоге любого уровня предусмотрено хранение файлов.
Для доступа к данным в многоуровневый каталогах следует указывать их адрес (путь к данным), который записывается через обратный слеш («»). Например, если корневой каталог имеет наименование «С», а папка второго уровня, в которой хранится файл 1.txt, называется «Новая папка», то путь к нему будет таким : С:Новая папка1.txt.
В Windows, с точки зрения ФС, во главе всех каталогов «стоит» папка «Рабочий стол», далее идут «Мой компьютер», «Корзина», «Сеть». «Мой компьютер» же состоит из дисков, установленных в персональном компьютере.
Файловые системы
Файловая система — абстракция, которая позволяет работать с данными на различных внешних накопителях так, чтобы для программ в операционной системе не видна была разница в аппаратной реализации. Файловая система позволяет на физическом устройстве выделять и освобождать постоянную память, заполнять её данными в асинхронном режиме, используя абстракцию файла. Кроме того, файловая система разрешает конфликты (говорят, коллизии) с именами файлов.
Один из методов решения коллизий — запретить создавать файлы с одинаковыми именами.
Первой моделью организации файлов была одноуровневая (или плоская) файловая система. Использовать такую файловую систему неудобно, если в операционной системе работает несколько пользователей и используется большое количество файлов. Однако одноуровневые файловые системы до сих пор применяются для определённых устройств. Например, в стиральных машинах или в микроволновых печах.
Продолжением одноуровневых файловых систем являются системы с фиксированным количеством уровней. Такие файловые системы используются на маршрутизаторах и телевизорах.
Самой успешной моделью файловой системы является иерархическая модель. Она произвела настоящую революцию в хранении данных. Иерархическая система подразумевает существование дерева данных с узлами трёх типов:
- корневая директория (каталог, папка) — специальный узел дерева;
- обычная директория (каталог, папка) — обычные узлы дерева;
- файлы — листья дерева.
Такая структура позволяет хранить файлы в разных директориях. Полное имя файла состоит из пути до файла в дереве директорий и имени файла. Таким способом обеспечивается уникальность имён. Файлы с одинаковыми именами не создают коллизии, если хранятся в разных директориях.
Один уровень иерархии от другого отделяется особым символом (например, / для Unix-подобных систем и для операционных систем на базе Windows). Поддерживаются и относительные имена файлов, из которых можно сформировать полное имя путём конкатенации (сложения строк) имени директории и относительного имени.
В Unix-подобных системах поддерживаются специальные директории: домашняя директория пользователя и текущая директория. Часть операционных систем вслед за Unix использует эти абстракции. Модель файловой системы Unix считается одной из наиболее удачных и безопасных, поскольку:
Файловая структура диска
Файловая структура диска — это совокупность файлов на диске и взаимосвязей между ними.
Файловые структуры бывают простыми и многоуровневыми (иерархическими).
Простые файловые структуры могут использоваться для дисков с небольшим (до нескольких десятков) количеством файлов. В этом случае оглавление диска представляет собой линейную последовательность имён файлов (рис. 2.8). Его можно сравнить с оглавлением детской книжки, которое содержит названия входящих в неё рассказов и номера страниц.
Иерархические файловые структуры используются для хранения большого (сотни и тысячи) количества файлов. Иерархия — это расположение частей (элементов) целого в порядке от высшего к низшим. Начальный (корневой) каталог содержит файлы и вложенные каталоги первого уровня. Каждый из каталогов первого уровня может содержать файлы и вложенные каталоги второго уровня и т. д. (рис. 2.9). В этом случае оглавление диска можно сравнить с оглавлением нашего учебника: в нём выделены главы, состоящие из параграфов, которые, в свою очередь, разбиты на отдельные пункты и т. д.
Пользователь, объединяя по собственному усмотрению файлы в каталоги, получает возможность создать удобную для себя систему хранения информации. Например, можно создать отдельные каталоги для хранения текстовых документов, цифровых фотографий, мелодий ит. д.; в каталоге для фотографий объединить фотографии по годам, событиям, принадлежности и т. д. Знание того, какому каталогу принадлежит файл, значительно ускоряет его поиск.
Графическое изображение иерархической файловой структуры называется деревом. В Windows каталоги на разных дисках могут образовывать несколько отдельных деревьев; в Linux каталоги объединяются в одно дерево, общее для всех дисков (рис. 2.10). Древовидные иерархические структуры можно изображать вертикально и горизонтально.
Работа с файлами
Файлы можно создать с помощью системы программирования и прикладного программного обеспечения.
Чаще всего, работая на компьютере над файлами, выполняются следующие операции:
- копирование (когда создаём копию файла в другом каталоге или на другом носителе);
- перемещение (когда переносим файла на другой носитель или в другой каталог, исходный файл уничтожаем);
- переименование (когда переименовывается собственно имя файла);
- удаление (когда объект уничтожается в исходном каталоге).
Если нужно найти файл, имя которого известно приблизительно, удобнее всего использовать маску имени файла. Маска представляет собой последовательность букв, цифр и прочих допустимых в именах файлов символов, которые допускаются в именах файлов, среди них могут встречаться такие символы: «?» (вопросительный знак) — что означает ровно один произвольный символ; символ «*» (звездочка) означает абсолютно любую (в том числе и пустую) последовательность символов произвольной длины.
По маске $m*.txt$ будут найдены все файлы, имена которых начинаются с буквы $«m»$, с расширением $txt$, , в том числе и файл $m.txt$. По маске $m?.*$ будут найдены файлы с любыми возможными расширениями и именами, состоящими из двух букв и начинающимися с буквы $«m»$. Ещё пример. Надо определить, какое из указанных имен файлов удовлетворяет маске:
- $5699.dtp$
- $151619.dot$
- $2256789.dtt$
- $11569.dot$
Решение
Получи деньги за свои студенческие работы
Курсовые, рефераты или другие работы
Автор этой статьи Дата написания статьи: 26.05.2016
Анастасия Николаевна Королева
Эксперт по предмету «Информатика»
Автор24 — это сообщество учителей и преподавателей, к которым можно обратиться за помощью с выполнением учебных работ.
Архивирование и разархивирование
Сжатие информации — это процесс преобразования информации файла к виду, при котором уменьшается избыточность в ее представлении и, соответственно, требуется меньший объем памяти для ее хранения.
Сжиматься могут как один, так и несколько файлов, которые в упакованном виде помещаются в так называемый архивный файл, или архив.
Архив — это специальным образом организованный файл, содержащий в себе один или несколько файлов в сжатом или несжатом виде и служебную информацию об их именах, датах и времени их создания или модификации, размерах и т. п.
Файлы архивов могут иметь формат ZIP, RAR, LZH, ARJ, ARC, TAR и др. в зависимости от программы–архиватора, с помощью которой они были созданы.
Файлы, упакованные в архив, занимают меньше места на диске и быстрее передаются по каналам связи в компьютерных сетях. Кроме того, упаковка группы файлов в один архивный файл значительно упрощает работу с ними: копирование, перенос на другой компьютер и т. п.
Принято различать архивацию и упаковку (или компрессию, сжатие) данных. В первом случае речь идет о слиянии нескольких файлов и даже каталогов в единый файл — архив, во втором — о сокращении объема исходных файлов путем устранения избыточности.
Процесс восстановления файлов из архива (на диск или в оперативную память) точно в таком виде, какой они имели до загрузки в архив, называется разархивацией (распаковкой) данных.
Принцип работы программ–архиваторов основан на поиске в файлах избыточной информации и последующем ее кодировании, позволяющем получить минимальный объем хранимых данных. В список задач архиваторов могут входить не только архивация или упаковка файлов, но и сохранение дерева файловой системы, атрибутов и имен файлов, шифровка данных архива, архивация с паролем и т. д.
Степень сжатия зависит от используемой программы, метода сжатия и типа исходного файла. Лучше всего упаковываются файлы графических образов, текстовые файлы и файлы данных, которые могут быть сжаты до 5–40 % от исходного размера. Хуже сжимаются файлы исполняемых программ и загрузочных модулей — до 60–90 %. Почти не сжимаются архивные файлы.
Большие по объему архивные файлы могут быть разбиты на несколько частей. Такие архивы называются многотомными, а их составные части — томами. Преимущество многотомных архивов в том, что их части можно записать на несколько носителей (диски, флеш–диски и пр.).
Чтобы при распаковке данных не зависеть от наличия соответствующей программы–архиватора, можно создать так называемый самораспаковывающийся архивный файл. Это загрузочный (исполняемый) модуль, который самостоятельно разархивирует находящиеся в нем данные при его запуске. Самораспаковывающийся архив называют также SFX–архивом (англ. SelF–eXtracting). Обычно они создаются в форме ЕХЕ–файла.
Наиболее популярными программами–архиваторами на сегодняшний день являются WinZip и WinRAR. «Родным» архивным форматом первого из них является формат ZIP, второго — RAR, несмотря на то что каждый из них поддерживает работу еще с десятками других архивных форматов.
Описание презентации по отдельным слайдам:
Лк 6 Структура хранения данных на внешних носителях информации
В качестве единицы хранения данных принят объект переменной длины, называемый файлом.
Файл – это последовательность произвольного числа байтов, обладающая уникальным собственным именем.
Обычно в отдельном файле хранят данные, относящиеся к одному типу. В этом случае тип данных определяет тип файла.
Файловая система
Файловая система – это порядок размещения, хранения и именования данных на носителе информации.
Файловые системы решают несколько задач:
Определяют правила построения имен файлов и каталогов;
Определяют, как именно размещаются файлы на диске;
Предоставляют программам функции для работы с файлами;
Обеспечивают защиту данных в случае сбоев и ошибок;
Обеспечивают установку прав доступа к данным для каждого пользователя;
Обеспечивают совместную работу с файлами.
Файловая структура
Хранение файлов организуется в иерархической структуре, которая в данном случае называется файловой структурой. В качестве вершины структуры служит имя носителя, на котором сохраняются файлы. Далее файлы группируются в каталоги (папки), внутри которых могут быть созданы вложенные каталоги (папки).
Каталоги (папки) – важные элементы иерархической структуры, необходимые для обеспечения удобного доступа к файлам, если файлов на носителе слишком много.
Файлы объединяются в каталоги по любому общему признаку, заданному их создателем (по типу, по принадлежности, по назначению, по времени создания и т. п.).
Каталоги низких уровней вкладываются в каталоги более высоких уровней и являются для них вложенными.
Верхним уровнем вложенности иерархической структуры является корневой каталог диска.
Все современные операционные системы позволяют создавать каталоги. Правила присвоения имени каталогу ничем не отличаются от правил присвоения имени файлу, хотя негласно для каталогов не принято задавать расширения имен. Все промежуточные каталоги разделяются между собой обратной косой чертой ().
Имя файла состоит из двух частей:
собственно имени и расширения файла.
В определении файла особое внимание уделяется имени. Оно фактически несет в себе адресные данные, без которых данные, хранящиеся в файле, не станут информацией из-за отсутствия метода доступа к ним. Кроме функций, связанных с адресацией, имя файла может хранить и сведения о типе данных, заключенных в нем.
В зависимости от расширения все файлы делятся на две большие группы: исполняемые и неисполняемые.
Исполняемые файлы – это такие файлы, которые могут выполняться самостоятельно, т. е. не требуют каких-либо специальных программ для их запуска. Имеют следующие расширения:
– exe – готовый к исполнению файл (tetris.exe; winword.exe);
– com – файл операционной системы (command.com);
– sys – файл операционной системы (Io.sys);
– bat – командный файл операционной системы MS-DOS (autoexec.bat).
Неисполняемые файлы для запуска требуют установки специальных программ. Так, например, для того чтобы просмотреть текстовый документ, требуется наличие какого-либо текстового редактора.
По расширению неисполняемого файла можно судить о типе данных, хранящихся в данном файле. Вот несколько примеров:
Физическая структура хранения информации
Принцип организации файловой системы – табличный. Поверхность жесткого диска рассматривается как трехмерная матрица, измерениями которой являются номера поверхности, цилиндра и сектора. Под цилиндром понимается совокупность всех дорожек, принадлежащих разным поверхностям и находящихся на равном удалении от оси вращения.
Файловая структура
Данные о том, в каком месте диска записан тот или иной файл, хранятся в системной области диска в специальных таблицах размещения файлов (FAT-таблицах).
Наименьшей физической единицей хранения информации является сектор. Размер сектора равен 512 байт.
Группы секторов условно объединяются в кластеры. Кластер является наименьшей единицей адресации к информации. Размер кластера, в отличие от размера сектора, не фиксирован и зависит от емкости диска.
Дерево каталогов в операционной системе Windows строится отдельно для каждого диска
FAT-16
Файловая система, наиболее распространенная на IBM PC-совместимых компьютерах, была введена еще в начале 80-х годов в операционных системах MS DOS 1.0 и 2.0. Эта файловая система достаточно примитивна, так как она была создана для хранения данных на дискетах. Обычно эта файловая система называется FAT, так как самой важной структурой данных в ней является таблица размещения файлов на диске, по-английски – file allocation table, сокращенно – FAT. Эта таблица содержит информацию о том, какие участки (кластеры) диска свободны, и о цепочках кластеров, образующих файлы и каталоги.
В файловой системе FAT имена файлов и каталогов должны состоять не более чем из 8 символов плюс три символа в расширении имени.
FAT 32
При разработке Windows 95 фирма Microsoft решила не вводить новую файловую систему, а залатать имеющуюся файловую систему FAT, позволив присваивать файлам и каталогам длинные имена. Эта файловая система стала называться FAT 32. Принятый в Windows 95 подход хорош тем, что позволяет использовать старые диски с файловой системой FAT – на них просто начинают записываться длинные имена. Но все же это решение весьма искусственное, и многие программы – для починки файловой системы дисков, «сжатия» дисков, резервного копирования и т. д., – могут привести к потере длинных имен на диске. FAT 32 поддерживает меньшие размеры кластеров, что позволяет более эффективно использовать дисковое пространство.
NTFS
При разработке операционной системы Windows NT была создана новая файловая система – NTFS. Она была ориентирована на диски большого объема, содержащие множество файлов, в них приняты существенные меры по обеспечению эффективности хранения данных и контроля доступа к ним.
Эта файловая система поддерживает длинные имена файлов. На логических дисках емкостью 1–2 Гбайта файловая система NTFS позволяет хранить в среднем на 10–15 % больше информации, чем FAT. А доступ к файлам в ней осуществляется заметно быстрее, особенно в многозадачной среде.
NTFS дублирует всю критически важную информацию и обеспечивает регистрацию всех изменений на дисках в специальном файле регистрации, причем для каждого изменения запоминается и способ его отмены. В результате практически при любых сбоях NTFS автоматически восстанавливается.
CDFS
Особая файловая система разработана для компакт-дисков (CD-ROM). Это оказалось необходимым, так как само физическое устройство компакт-дисков не такое, как у жестких дисков или дискет: в них информация записывается не в кольцевых дорожках, а в единственной спиралеобразной дорожке (как у аудиокомпакт-дисков). Эта файловая система называется CDFS
ОС и виды файловых систем
Самые популярные ОС («Виндовс», macOS и «Линукс») работают с различными видами ФС, которые обычно предустановлены и не нуждаются в дополнительных конфигурациях. В Windows на всех разделах диска используют NTFS, а на флешках — NTFS либо FAT32. На «Андроид» производитель устанавливает ext4 в памяти устройства и FAT32 на SD-картах. Пользователи Apple обычно даже не знают о разновидности применяемой файловой системы. А владельцы Linux должны быть хоть немного программистами, чтобы настроить определенный вид FS в своей ОС. Пользователи редко встречаются с необходимостью использования альтернативной файловой системы, но время от времени это происходит. Поэтому расскажем более подробно о разновидностях ФС.
FAT увидел свет в 80-х годах XX века, когда первый наемный сотрудник Microsoft Марк Макдональд создал исходный код по личной просьбе Билла Гейтса. Позже были выпущены версии FAT12, FAT16 и FAT32. Последняя сейчас очень популярна. По прошествии определенного времени выпустили еще две усовершенствованные системы NTFS и ReFS.
Классическая файловая система применяется для небольших носителей информации и несложного структурирования сведений. Числа, идущие после аббревиатуры FAT, означают число бит, отведенных для хранения кластера. Хотя FAT32 выступает в роли образца, постепенно распространяется самая новая вариация этой ФС — exFAT, или FAT64. Преимущество FAT32 в том, что ее возможно использовать не только в новых, но и устаревших моделях техники. Недостаток — система ограничивает размер сохраняемых файлов до 4 ГБ, а всего раздела — до 8 ТБ. Поэтому FAT32 обычно применяют в переносных USB-носителях данных.
Чтобы устранить недостатки FAT32, Microsoft обновила файловую систему до версии exFAT. Среди преимуществ — гораздо больший объем сохраняемого файла и снижение количества перезаписей кластеров. Последний момент крайне важен для твердотельных накопителей, т. к. после установленного числа операций записи ячейки памяти изнашиваются. Стандарт exFAT непосредственно работает с ОС Android, Windows, Mac. «Линуксу» же нужно дополнительное ПО.
Версия призвана устранить выявленные недостатки FAT. Сегодня это — основная ФС для «Виндовс». Максимальный размер сохраняемого файла составляет 16 ГБ. Способ “прозрачного шифрования» разграничивает доступ к информации для разных пользователей и не дает последним воспользоваться содержимым без соответствующего разрешения. NTFS применяет расширенные имена файлов, поддерживая многоязычность. Стандартное приложение chkdsk проверяет носитель на ошибки ФС, чем увеличивает надежность работы накопителя, но уменьшает его производительность.
Самый современный продукт «Майкрософт» для серверов «Виндовс» 8 и 10. Файловая система почти не знает отказов в работе благодаря оснащению новым функционалом:
- Copy-on-Write (CoW) — все метаданные подлежат изменению только после копирования.
- Запись информации происходит на свободное пространство накопителя, а не вместо ранее сохраненных файлов.
- Модифицируя метаданные, система сохраняет новую копию в пустых кластерах, а затем создает ссылку на нее из старых метаданных.
Эти средства позволяют более надежно хранить информацию, а также оперативно восстанавливать сведения.