Файл: что такое, его имя, свойства, формат, части. Информатика
Статья ознакомит с понятием файловой системы (ФС), файла в среде Windows, их свойствами и характеристиками. Кратко рассмотрим принципы хранения, адресации информации на компьютере, разберёмся, из чего состоит имя файла (документа), с правилами написания их имён.
Долговременно информация на компьютере хранится на энергонезависимых элементах памяти – твердотельных и жёстких дисках. Физически она представляет собой последовательность единиц и ноликов. На накопителе они хранятся в виде электрических или магнитных зарядов.
Для хранения информации на накопителе его необходимо отформатировать – сформировать файловую систему – это в информатике порядок, методика организации хранения данных на цифровых носителях. От неё зависит формат файлов, их атрибуты, способ записи на накопитель, порядок обращения, свойства, возможности (работа с архивными версиями, разделение прав доступа).
На устройствах с ОС Windows наиболее распространены ФС FAT32 (старая) и NTFS.
Управление файлами
На компьютерах с операционной системой Windows пользователи могут управлять и организовывать свои файлы с помощью проводника Windows.
Как это работает
Файл представляет собой контейнер для массива данных. Его формат/расширение определяется содержимым. Записать в этот контейнер можно любую информацию, как и прочитать ее из него. К примеру, простой текст мы сохраняем в file.txt.
Работает все просто — вы открываете FILE на компьютере, операционная система по его расширению находит программу, которая с ним может работать и запускает ее.
Что такое файл, расширение и т.п.
Именно на заре компьютерной эры сформировалось современное понимание файлов и были введены такие понятия, как файловая система (это когда один физический носитель информации разбивался на логические разделы со своими особенностями) и файловые расширения (изначально названия файлов состояли из двух частей, которые в последствии стали называться именем файла и расширением, соответственно).
В современных файловых системах используются еще и адреса файлов (ссылки на них), которые показывают путь, где его можно будет найти на данном конкретном носителе (физическом или логическом). Такой путь может выглядеть, например, так d:Dropboxчерновик.html «».
Имя файла используется во всех существующих операционных система (во многих из них существует ограничение на количество используемых в имени символов), а вот расширение как таковое не всегда учитывается (во многих ОС оно считает частью имени, как, например, в Линуксе). Зато в UNIX-подобных операционных системах используют права доступа на файлы и папки, о которых я уже довольно подробно писал на этом блоге. Это позволяет повысить безопасность работы с файлами и устойчивость системы к взломам и заражению вирусами.
Однако в Windows расширение файла несет очень даже значимую нагрузку, позволяя понять, каким именно приложением (программой) следует открывать данный файл. В этой операционной системе можно назначать соответствие расширению и программе, которая будет автоматически пытаться открывать файлы данного типа.
В силу всего вышесказанного получается, что файл — это довольно-таки сложная вещь, о которой знают все, но мало кто представляет как это все работает. Операции над файлами могут быть двух типов: операции над тем, что содержится внутри контейнера (это открытие и внесение изменений), и операции с самим контейнером (переименование, копирование, удаление и т.п.).
По сути, файл — это контейнер для хранения информации (как прозрачный «файл» в офисе), который имеет внешние свойства (размер, название, путь до него) и внутренние свойства, которые, по сути, не очень важны для тех, кто смотрит на него снаружи (а не изнутри с помощью соответствующей программы).
Например, текстовый файл снаружи характеризуется тем, что он лежит в определенной папке, имеет такой-то размер (вес) и как-то там называется. При этом внутри он выглядит как набор текстовых символов, сохраненных для тех или иных нужд. Для внешних пользователей это всего лишь объект, а для внутренних — это может быть, например, интересная книга (заключенная в текстовый файл).
Кстати, папка (каталог) на вашем компьютере — это тоже файл, но только содержащий в себе информацию о заключенных в него файлах (по сути, это контейнеры, находящие внутри другого контейнера). Правда папки можно создавать средствами операционной системы, а вот для создания большинства типов файлов понадобится использование специальных программ (например редакторов — текстовых, видео, аудио и т.п.).
Как я уже упоминал, в Виндовс можно по внешним признакам понять, что за файл мы имеем. Для этого нужно будет просто посмотреть на его расширение. Правда типов расширений довольно-таки много, и зачастую приходится поломать голову, какой-же программой открыть тот или иной файл. Но это уже тема отдельного разговора.
Пример использования
Допустим, на рабочем столе находится четыре фото, три фильма и пять документов. Некоторые отмечены значками, другие же — анонсом, примерным показом их содержимого. Все эти объекты называются файлы .
Их можно рассортировать по категориям с соответствующими названиями. Создать папку «фото» и добавить в нее снимки, в «фильмы» переместить видео, а в «документы» сложить документы. Получится всего три значка, внутри которых будут нужные данные.
Теперь каждый тип данных будет в своём каталоге. Но необязательно только этот тип, можно добавить и другие объекты. Например, в «фильмы» положить документы.
Кроме того, внутри одной папки можно сделать другие папки. Например, в категории «фото» много снимков с разных мероприятий. Для удобства можно создать внутри несколько папок и рассортировать изображения. Снимки с Нового года отправить в один каталог, со Дня Рождения — в другой.
Работа с файлами
Создаются файлы с помощью систем программирования и прикладного программного обеспечения.
В процессе работы на компьютере над файлами наиболее часто проводятся следующие операции:
- копирование (создаётся копия файла в другом каталоге или на другом носителе);
- перемещение (производится перенос файла в другой каталог или на другой носитель, исходный файл уничтожается);
- переименование (производится переименование собственно имени файла);
- удаление (в исходном каталоге объект уничтожается).
При поиске файла, имя которого известно неточно, удобно использовать маску имени файла. Маска представляет собой последовательность букв, цифр и прочих допустимых в именах файлов символов, среди которых также могут встречаться следующие символы: «?» (вопросительный знак) — означает ровно один произвольный символ; «*» (звездочка) — означает любую (в том числе и пустую) последовательность символов произвольной длины.
Например, по маске n*.txt будут найдены все файлы с расширением txt, имена которых начинаются с буквы «n», в том числе и файл n.txt. По маске п?.* будут найдены файлы с произвольными расширениями и двухбуквенными именами, начинающимися с буквы «n».
Файловые системы
Файловая система — абстракция, которая позволяет работать с данными на различных внешних накопителях так, чтобы для программ в операционной системе не видна была разница в аппаратной реализации. Файловая система позволяет на физическом устройстве выделять и освобождать постоянную память, заполнять её данными в асинхронном режиме, используя абстракцию файла. Кроме того, файловая система разрешает конфликты (говорят, коллизии) с именами файлов.
Один из методов решения коллизий — запретить создавать файлы с одинаковыми именами.
Первой моделью организации файлов была одноуровневая (или плоская) файловая система. Использовать такую файловую систему неудобно, если в операционной системе работает несколько пользователей и используется большое количество файлов. Однако одноуровневые файловые системы до сих пор применяются для определённых устройств. Например, в стиральных машинах или в микроволновых печах.
Продолжением одноуровневых файловых систем являются системы с фиксированным количеством уровней. Такие файловые системы используются на маршрутизаторах и телевизорах.
Самой успешной моделью файловой системы является иерархическая модель. Она произвела настоящую революцию в хранении данных. Иерархическая система подразумевает существование дерева данных с узлами трёх типов:
- корневая директория (каталог, папка) — специальный узел дерева;
- обычная директория (каталог, папка) — обычные узлы дерева;
- файлы — листья дерева.
Такая структура позволяет хранить файлы в разных директориях. Полное имя файла состоит из пути до файла в дереве директорий и имени файла. Таким способом обеспечивается уникальность имён. Файлы с одинаковыми именами не создают коллизии, если хранятся в разных директориях.
Один уровень иерархии от другого отделяется особым символом (например, / для Unix-подобных систем и для операционных систем на базе Windows). Поддерживаются и относительные имена файлов, из которых можно сформировать полное имя путём конкатенации (сложения строк) имени директории и относительного имени.
В Unix-подобных системах поддерживаются специальные директории: домашняя директория пользователя и текущая директория. Часть операционных систем вслед за Unix использует эти абстракции. Модель файловой системы Unix считается одной из наиболее удачных и безопасных, поскольку:
Файл и документ — это одно и то же?
Файлами называют вообще любые последовательности байтов на диске, у которых есть имя и адрес. Если файл зашифрован, не открывается, внутри него сбои или пустота — это всё равно файл.
Документом называют файл, в котором лежит что-то полезное для пользователя, что он может открыть и с чем может осмысленно взаимодействовать. Например, ваша курсовая работа в формате Word — для вас это документ, а для компьютера — файл.
Для сравнения, системная библиотека программы Microsoft Word — это не документ, а просто файл. Вы не можете его открыть, но его использует программа Word для работы.