Информационные технологии
универсальный стандарт, определяющий кодировку символов двоичным кодом.
электронная почтовая служба.
Базовая система ввода-вывода.
программно- технологические средства специального класса.
файловая система, отвечающая стандарту ISO 9660, описывающему расположение информации на CD-ROM.
Метод с помощью которого гипертекстовые документы передаются с сервера для просмотра на компьютеры
Протокол FTP (File Transfer Protocol) – метод, используемый для обеспечения передачи файлов между разнообразными системами.
Протокол HTTP (Hypertext Transfer Protocol) – метод, с помощью которого гипертекстовые документы передаются с сервера для просмотра на компьютеры к отдельным пользователям.
Региональная вычислительная сеть – сеть, связывающая компьютеры в пределах определенного региона.
Редакторы текстов – программы подготовки и редактирования текстов на ЭВМ.
Сайт (Site) – адрес размещения сервера в Internet. Часто так называют всю совокупность Web-страниц, расположенных на сервере.
Сервер (Server) – сетевой узел, содержащий данные и предоставляющий услуги другим компьютерам; компьютер, подключенный к сети и используемый для хранения информации.
Сетевые программы – программы приема и передачи данных в сетях ЭВМ.
Сеть (Network) – система взаимодействующих элементов, связанных между собой по выделенным или коммутируемым линиям для обеспечения локальной или удаленной связи (голосовой, визуальной, обмена данными и т.п.) и для обмена сведениями между пользователями, имеющими общие интересы.
Система (в предметной области) – множество взаимосвязанных элементов, каждый из которых связан прямо или косвенно с каждым другим элементом, а два любые подмножества этого множества не могут быть независимыми, не нарушая целостность, единство системы.
Система управления базами данных (СУБД) – совокупность программных и языковых средств, предназначенных для управления данными в базе данных, ведения этой базы, обеспечения многопользовательского доступа к данным.
Сортировка данных – упорядочение данных по определенному признаку.
Ссылка (Link) – элемент документа, использующийся для создания связей внутри данного документа и связей с другими документами. В последнем случае правильнее говорить о гиперссылке.
Средства проектирования и просмотра web – документов
Пользователи web создают свои документы с помощью специального языка описания гипертекстовых документов – HTML (HyperText Markup Language — язык разметки гипертекста). Стандарт html3.2 был предложен в начале 1996 года совместно компаниями W3C, IBM, Microsoft и др., html4 – последняя версия и дополнена новыми возможностями.
Программы для просмотра Web-страниц называют броузерами. В литературе также можно встретить «неустоявшиеся» термины браузер или обозреватель. Во всех остальных случаях речь идет о некотором средстве просмотра Web-документов.
Данный язык не является как таковым языком программирования. Он содержит тэги (коды), которые предоставляют броузеру определенную информацию, объясняя, как именно должен выглядеть тот или иной объект документа в броузере. Т.о. html-документ представляет собой текстовый файл. А поэтому написание html–документа может осуществляться с помощью любого текстового редактора, будь то блокнот, Wordpad или MS Word, главное, что следует запомнить, что сохранять созданный документ следует не с расширениями .txt или .doc, а с расширением html или htm. Возможно так же использование приложений из пакета Ms Office – Excel, PowerPoint и др. для создания html-документов, последние версии которых позволяют сохранить файл в соответствующем формате.
Написание web-документов непосредственно на HTML имеет преимущества, так как приложения Word, Excel часто ограничены в своих возможностях, содержат ошибки или производят плохой HTML код, который может не работать на различных платформах.
Основные понятия
Web-страница – это документ, размеченный тэгами html. Тэги – это управляющие коды, заключенные в угловые скобки (<>). Тэги определяют параметры стиля изображаемого текста или графического объекта. Обычно тэги записываются прописными буквами.
Документ состоит из двух частей: head и body (заголовок и тело). Существуют самостоятельные тэги, парные и тэги с атрибутами.
Гипертекст – документ, в котором имеются гиперссылки. Гипер- ссылка – это фрагмент информации, который является указателем на другой объект. Для передачи web-страницы с сервера на компьютер клиента используется специальный протокол http – hypertext transfer protocol – протокол передачи гипертекста. Клиент сети может создать свою web-страницу и разместить ее на сервере, тем самым сделав ее доступной для других клиентов сети.
Для просмотра web–документа открывается броузер и в строке адреса записывается URL-адрес (Uniform Resource Locator – единый указатель на ресурс) интересующей web-страницы. Происходит загрузка соответствующего файла в окно броузера. Далее при указании на ссылку происходит перемещение на объект, помеченный ссылкой. Перемещение происходит быстро, если объект находится в этом же файле и медленнее, если объекты находятся в других файлах, разбросанных по всему пространству web-серверов.
Структура web – документа
Web-документ состоит из двух частей: заголовка и тела.
На языке HTML структура выглядит следующим образом:
Область HEAD необязательна, но желательна, т.к. может содержать область TITLE, задающую заголовок документа, который располагается в строке заголовка окна броузера, и другие характеристики файла.
Тэг BODY может так же содержать атрибуты – цвет фона документа BGCOLOR, цвет текста TEXT, цвет текста ссылки LINK, текста выбранной гиперссылки VLINK, url-адрес BACKGRAUND, где находится фон документа.
Для спецификации цвета, как значения атрибута, существуют два варианта:
1) Символьная, напрмер, RED. Определено шестнадцать таких имен которые можно записывать в любом регистре с кавычками или без. Цифровое обозначение в шестнадцатиричной записи, например, «#FF0000», которая контролирует, каким образом цвет формируется из основных цветов — красного, зеленого и голубого — в так называемое sRGB цветовое пространство, при этом обозначение должно быть взято в кавычки.
Структура web – узла
Web-узел может содержать в себе большое количество web-документов, соединенных между собой гиперссылками. В зависимости от установленных связей между документами, структура узла может быть линейной или нелинейной. Нелинейная представлена двумя видами связей: иерархической и сетевой.
В узле линейной структуры возможен переход от предыдущего документа к последующему и в обратном порядке – от последующего к предыдущему. В узле иерархической структуры возможен переход от предыдущего документа к нескольким последующим и в обратном порядке – от нескольких последующих к одному предыдущему. В узле сетевой структуры возможен переход от любого документа к любому документу.
Линейный web – узел структурно ограничен, но позволяет легче ориентироваться при перемещении по узлу. Сетевой web – узел имеет более широкие возможности при перемещении, но затрудняет восприятие последовательности перемещений по документам. Для удобства в каждом документе должна быть ссылка на домашнюю страницу (первый документ, он может иметь оглавление, содержащее список других документов данного web – узла).
Служба передачи файлов (FTP). Прием и передача файлов составляют значительный процент от прочих Интернет услуг. Необходимость в передаче файлов возникает, например, при приеме файлов программ, при пересылке крупных документов (например, книг), а также при передаче архивных материалов, в которых запакованы большие объемы информаций.
Сервисные инструментальные средства: архиваторы, электронные словари, переводчики, программы распознавания текста.
АРХИВАТОРЫ
Различают архивацию и упаковку данных:
— архивация предполагает слияние нескольких файлов и даже каталогов в единый файл – архив;
— упаковка – сокращение объема путем устранения избыточности с возможностью точного восстановления исходного файла.
Современные архиваторы являются и упаковщиками. Многие популярные архиваторы появились в эпоху господства DOS – ZIP, LZH, ARJ, ARC, ICE.
Наиболее известные архиваторы;
1. ZIP-ориентированныеWINZIP (Nico Mark Computing)
— ZIPMAGIC (Mijenix)Zip Explorer Pro (Aeco Systems)
2. ARJ-ориентированные ARJF older (Рафаэль Мунье)WINARJ (LA Software)
3. RAR- WINRAR (Евгений Рошаль)
— создать новый архив;
— добавить файл в архив;
— удалить файл из архива;
— переместить файл в архив;
— просмотреть содержимое архива;
— обновить содержимое архива;
— разархивировать файл (архив);
— создать многотомный архив;
— создать самораспаковывающийся архив;
— извлечь файлиз архива.
— метод сжатия файлов
— степень сжатия файлов
— поддержка форматов других архиваторов
— поддержка манипуляции с помощью перетаскивания.
ЭЛЕКТРОННЫЕ СЛОВАРИ
Современные средства контроля позволяют обнаруживать и исправлять орфографические и грамматические ошибки. Выделяют 6 основных типов ошибок: слияние и разбиение слов, замена, пропуск, вставка и перестановка букв и слов. Если в слове есть ошибка, то подстановка всех букв алфавита приведет к нахождению корректного слова (т.е. которое содержится в словаре системы). Трудность – локализация ошибок и анализ многократных ошибок. Другая особенность проверки ошибок – многие опечатки приводят к корректным словам «математический модуль». Обнаружение ошибки возможно только после анализа всего предложения.
Анализ грамматической корректировки предложения основывается на применении множества правил. Автоматический контроль – подчеркивание красной волной.
ПЕРЕВОДЧИКИ
Современные системы машинного перевода относят к классу систем искусственного интеллекта. Процесс представляет собой последовательность преобразований , применяемых к тексту на исходном языке и превращений его в переведенный текст. При этом переведенный текст должен максимально воссоздать смысл и структуру переведенного текста, но уже средствами языка, на который осуществляется перевод. Но текст требует последовательного редактирования. Применяются:
— в отраслевых службах информации большого потока;
— в крупных международных организациях;
— в службах, где переводятся техническая документация;
— для синхронного перевода (погода).
Система машинного перевода Промт для перевода текста с учетом морфологических и синтаксических особенностей. Поставляются в двух вариантах: для конкретного языка и ГИГАНТ. Система Промт имеет генеральный словарь (более 130 тыс. слов и словосочетаний). Система вначале просматривает специализированные словари, а затем генеральный.
Чем отличаются HTTP и HTTPS
HTTPS – это расширение протокола HTTP, которое обеспечивает защиту передаваемых данных. Для сайта это важный параметр, так как шифрование позволяет ему обезопасить информацию, которую туда вводят люди (пароли, реквизиты кредитных карт), от хакерских атак. HTTP-протокол передает данные в открытую, поэтому их легко перехватить.
HTTPS защищен SSL-сертификатом. Благодаря ему уязвимые данные шифруются сначала на клиенте (браузере, например) в результате чего они становятся похожи на случайный набор символов и только потом отправляются на сервер. Каждый раз при HTTP-запросе шифр меняется, поэтому успеть подобрать ключ и украсть данные довольно трудно.
Сейчас защищенное соединение есть у большинства сайтов, причем многие браузеры по умолчанию уже работают только с https. Это легко проверить: в адресной строке браузера обычно стоит замок или она помечена зеленым цветом. Это показывает, что сайт подлинный и у него есть SSL-сертификат.
IT-рентген: Узнайте, какая специальность подходит вам
Определите, какое направление больше вам подходит и как сделать первые шаги в IT. Dы получите доступ к библиотеке материалов и видео для направлений: Data Science, Программирование, Анализ данных.
Компоненты WWW¶
Функционирование сервиса обеспечивается четырьмя составляющими:
- URL/URI — унифицированный способ адресации и идентификации сетевых ресурсов;
- HTML — язык гипертекстовой разметки веб-документов;
- HTTP — протокол передачи гипертекста;
- CGI — общий шлюзовый интерфейс, представляющий доступ к серверным приложениям.
Адресация веб-ресурсов. URL, URN, URI
Для доступа к любым сетевым ресурсам необходимо знать где они размещены и как к ним можно обратиться. Во Всемирной паутине для обращения к веб-документам изначально используется стандартизованная схема адресации и идентификации, учитывающую опыт адресации и идентификации таких сетевых сервисов, как e-mail, telnet, ftp и т.п. — URL, Uniform Resource Locator.
URL (RFC 1738) — унифицированный локатор (указатель) ресурсов, стандартизированный способ записи адреса ресурса в www и сети Интернет. Адрес URL имеет гибкую и расширяемую структуру для максимально естественного указания местонахождения ресурсов в сети. Для записи адреса используется ограниченный набор символов ASCII. Общий вид адреса можно представить так:
схема обращения к ресурсу: http, ftp, gopher, mailto, news, telnet, file, man, info, whatis, ldap, wais и т.п.
В августе 2002 года RFC 3305 анонсировал устаревание URL в пользу URI (Uniform Resource Identifier), еще более гибкого способа адресации, вобравшего возможности как URL, так и URN (Uniform Resource Name, унифицированное имя ресурса). URI позволяет не только указавать местонахождение ресурса (как URL), но и идентифицировать его в заданном пространстве имен (как URN). Если в URI не указывать местонахождение, то с его помощью можно описывать ресурсы, которые не могут быть получены непосредственно из Интернета (автомобили, персоны и т.п.). Текущая структура и синтаксис URI регулируется стандартом RFC 3986, вышедшим в январе 2005 года.
Язык гипертекстовой разметки HTML¶
HTML ( `HyperText Markup Language <>`_ ) — стандартный язык разметки документов во Всемирной паутине. Большинство веб-страниц созданы при помощи языка HTML. Язык HTML интерпретируется браузером и отображается в виде документа, в удобной для человека форме. HTML является приложением SGML (стандартного обобщённого языка разметки) и соответствует международному стандарту ISO 8879.
HTML создавался как язык для обмена научной и технической документацией, пригодный для использования людьми, не являющимися специалистами в области вёрстки. Для этого он представляет небольшой (сравнительно) набор структурных и семантических элементов — тегов. С помощью HTML можно легко создать относительно простой, но красиво оформленный документ. Изначально язык HTML был задуман и создан как средство структурирования и форматирования документов без их привязки к средствам воспроизведения (отображения). В идеале, текст с разметкой HTML должен единообразно воспроизводиться на различном оборудовании (монитор ПК, экран органайзера, ограниченный по размерам экран мобильного телефона, медиа-проектор). Однако современное применение HTML очень далеко от его изначальной задачи. Со временем основная идея платформонезависимости языка HTML стала жертвой коммерциализации www и потребностей в мультимедийном и графическом оформлении.
Протокол HTTP¶
HTTP ( `HyperText Transfer Protocol <>`_ ) — протокол передачи гипертекста, текущая версия HTTP/1.1 (RFC 2616). Этот протокол изначально был предназначен для обмена гипертекстовыми документами, сейчас его возможности существенно расширены в сторону передачи двоичной информации.
HTTP — типичный клиент-серверный протокол, обмен сообщениями идёт по схеме «запрос-ответ» в виде ASCII-команд. Особенностью протокола HTTP является возможность указать в запросе и ответе способ представления одного и того же ресурса по различным параметрам: формату, кодировке, языку и т. д. Именно благодаря возможности указания способа кодирования сообщения клиент и сервер могут обмениваться двоичными данными, хотя данный протокол является символьно-ориентированным.
HTTP — протокол прикладного уровня, но используется также в качестве «транспорта» для других прикладных протоколов, в первую очередь, основанных на языке XML (SOAP, XML-RPC, SiteMap, RSS и проч.).
Общий шлюзовый интерфейс CGI¶
CGI ( `Common Gateway Interface <>`_ ) — механизм доступа к программам на стороне веб-сервера. Спецификация CGI была разработана для расширения возможностей сервиса www за счет подключения различного внешнего программного обеспечения. При использовании CGI веб-сервер представляет браузеру доступ к исполнимым программам, запускаемым на его (серверной) стороне через стандартные потоки ввода и вывода.
Интерфейс CGI применяется для создания динамических веб-сайтов, например, когда веб-страницы формируются из результатов запроса к базе данных. Сейчас популярность CGI снизилась, т.к. появились более совершенные альтернативные решения (например, модульные расширения веб-серверов).
Метод с помощью которого гипертекстовые документы передаются с сервера для просмотра на компьютеры
Занятие 12 по курсу “Информационные технологии”
Тема. Гипертекстовые способы хранения и представления информации. Информационные ресурсы Интернета
Результаты освоения темы
- что такое гипертекст и гипертекстовые информационные технологии;
- как и какие языки используются для гипертекстовой разметки документов;
- какие информационные ресурсы есть в Интернете и как их классифицируют.
использовать язык HTML для гипертекстовой разметки документов.
1. Гипертекстовые информационные технологии
Гипертекст (нелинейный текст) – это организация текстовой информации, при которой текст представляет множество фрагментов с явно указанными связями между этими фрагментами.
- соединение текста на естественном языке с создаваемой компьютером возможностью интерактивного формирования внутри него новых ветвей;
- динамичную организацию нелинейного текста, который уже не может быть напечатан обычным образом на обычной странице.
Гипертекст можно рассматривать как своеобразную базу данных, организуемую в виде открытой, свободно наращиваемой и изменяемой сети, узлы которой (линейные тексты) соединяются пользователем. От обычной базы данных гипертекст отличается, прежде всего, тем, что в нём отсутствуют заранее заданные ограничения на характер связей и структуру.
В 1987 году фирма Apple выпустила первую для ПК гипертекстовую систему – пакет HyperCard для Macintosh.
Эффективно применять гипертекстовые технологии стало возможным с 1992 года, когда появился WWW и возникли веб-технологии.
WWW (сокращение от англ. “World Wide Web” – “мировая паутина”, “всемирная паутина” или “всемирная сеть”) – это глобальный механизм обмена информацией; информационная система и популярная служба Интернета. Это самое распространённое приложение Интернета.
Основой WWW являются протокол передачи гипертекстовых данных (HTTP) и язык гипертекста (HTML), т.е. гипертекстовые технологии.
HTTP – это гипертекстовый транспортный протокол для связи веб-серверов и веб-клиентов. Он предназначен для построения распределённых информационных сетей коллективного пользования, поддерживающих различные типы данных (текст, изображение, аудио- и видеоинформация) и загрузки веб-страниц (файлов).
Элементы гипертекста (текстовые фрагменты) называются узлами. Узлы, между которыми возможен переход, называют смежным, а возможность перехода – “связью”. Совокупность смежных узлов образует “окрестность” данного узла. В общем случае в качестве узла могут выступать: слово; словосочетание; предложение; абзац; параграф; документ; собрание документов, относящихся к одной теме; отдельные сообщения и т.п. Создание гипертекста, прежде всего, состоит в формировании системы переходов от узла к узлу (системы ссылок). Движение в гипертекстовой сети, совершаемое в процессе чтения гипертекста, называется “навигацией”.
Гипертекстовая технология реализуется в конкретной гипертекстовой системе, состоящей из гипертекста (базы данных) и гипертекстовой оболочки. Гипертекст содержит не только информацию, но также аппарат её эффективного поиска и просмотра. Путешествие по WWW (всемирной паутине) начинается с ввода электронного адреса в строку местоположения (Locator) и нажатия затем кнопки “Enter”.
Просмотр (браузинг) – это операция, характерная только для гипертекста. Он означает поиск информации посредством просмотра гипертекстовой сети, при этом возможно запоминание пути следования для того, чтобы при последующем аналогичном запросе поиск проходил по зафиксированному пути следования. Ныне чаще всего используются следующие программы-браузеры: Internet Explorer, Netscape Navigator, Opera и др.
- настольных издательских системах для создания документов большого объёма со свойствами гипертекста (т. е. с системой ссылок);
- системах управления документами (СУД), например, для сведения в один итоговый документ информации, содержащейся в разнородных документах;
- системах подготовки электронных документов, позволяющих составлять гипертекстовые документы с возможностью осуществления навигации и др.
Одним из перспективных направлений развития гипертекстовых систем является технология гипермедиа – соединение технологий гипертекста и мультимедиа (интеграция текста, графики, звука, видео).
Использование гипертекста позволяет создать информационную инфраструктуру распределённой организации и упростить диалоговый интерфейс пользователя, что важно при разработке информационных приложений. Гипертекстовые технологии способствовали созданию в информационных сетях информационных хранилищ, которым могут получать доступ самые различные категории пользователей. В результате в Интернете сформированы огромные и свободно доступные широким массам пользователей (открытые) самые разнообразные информационные ресурсы.
Основная идея гипертекстовых технологий состоит в том, что поиск документальной информации происходит с учётом множества взаимосвязей, имеющихся между документами, а значит, более эффективно, чем при традиционных методах поиска. При этом доступ к информации осуществляется не последовательным просмотром текста, как в обычных информационно-поисковых системах, а путём движения от одного фрагмента к другому.
В общем случае взаимодействие пользователя с гипертекстовой системой заключается в том, что он видит на экране компьютера некоторый текст и (или) графический объект и, в зависимости от возникающих у него ассоциаций, может выполнять ряд действий (главным образом переходов к другим, предлагаемым на данной странице, объектам).
2. Языки гипертекстовой разметки документов
Гипертекстовая технология изначально использовала специальный язык, получивший название HTML (Hyper Text Markup Language). Благодаря ему, можно не только формировать гипертекстовые документы, но осуществлять связь текста и изображения с документами, расположенными на другом веб-сервере и др.
Гиперссылка или Гиперсвязь (Hyperlink) – фрагмент HTML-документа, указывающий на другой файл, который может быть расположен в Интернете или содержать полный путь к этому файлу. Гиперссылка для пользователя – это графическое изображение, текст на сайте или в письме электронной почты, устанавливающие связь и позволяющие переходить к другим объектам Интернета.
Гипертекстовый документ, размещённый на сервере с использованием WWW, называют Web-страницей (веб-страницей). Это минимальный фрагмент гипертекста, который можно за один раз загрузить и прочитать.
Используя предлагаемые связи можно читать материал в любом порядке. Таким образом, текст становится “открытым”. В него можно вставлять любые объекты, указывая для них связи с имеющимися объектами. При этом структура текста не разрушается. Поэтому гипертекст стал новой информационной технологией представления неструктурированного легко наращиваемого знания.
Структура гипертекстовых документов формируется с помощью последовательности тегов – элементов языка HTML, включающих тексты в формате ASCII. Они позволяют управлять шрифтом, цветом фона и текста, определять ссылки, вставлять объекты (графику, звук и видео). При этом сами тэги на странице в режиме её просмотра через браузер не видны.
Тег или тэг (англ. “Tag” – метка) является признаком объекта, который управляет соответствующим кодом.
Любая страница начинается с тега и заканчивается тегом .
Легко заметить, что теги представляют собой некоторые операторы (команды, дескрипторы), заключенные в скобки типа “< >”, причём ими начинается и заканчивается целая страница или некоторый фрагмент. В конце команды ставится слеж “/” с именем, используемым в её начале. Таким образом, любая команда включает некоторое действие, а аналогичная команда со знаком “/” – выключает его. Это правило касается парных команд (дескрипторов). Существуют операторы, не требующие их выключения (закрытия).
В качестве примера приведём запись следующих заголовков “Министерство образования и науки Российской Федерации” и “Московская финнансово-промышленная академия”, последовательно размещённых на одной странице. Запись в файле может выглядеть следующим образом:
Московская финнансово-промышленная академия
При этом оператор используется как заголовок страницы. Он не виден в программе просмотра гипертекстовых страниц, но отображается в верхней строке браузера. Обычно эта команда используется как идентификатор страницы и служит поисковым образом документа.
Оператор ограничивает область заголовка, включающую другие операторы, отражающие название программы, в которой создавалась страница, код страницы, ключевые слова (мета тэги) и др.
Оператор включает область, где размещаются все основные команды, входящие в состав данной страницы. Все эти операторы парные и они обязательно включают команды их закрытия.
Ссылка обозначается парными тегами и .
Некоторые теги могут быть разовыми, например, для обозначения перехода на другую строку в одном абзаце используется непарный тег
.
Точно также внутри таблицы, образуемой парными тегами < Table >и < /Table >, могут присутствовать непарные теги < tr >и < td >, отражающие строку и ячейку в строке.
Чтобы при установке мыши на пиктограмме появлялся поясняющий текст, следует в тэг
(< a href =. ) включить параметр (alt="текст пояснения"), например,
В таком тексте не должно быть кавычек, символов “” (больше), «/» и т.п. Их заменяют записями типа " < >.
Кроме того, используется CGI (Common Gateway Interface – общий шлюзовой интерфейс) – программа для связи HTML-браузеров с другими прикладными программами и (или) текстами, находящимися на стороне сервера.
Для создания гипертекстовых документов и веб-страниц применяют как обычное ПО, так и специальные программы. В простейшем случае для создания гипертекстовых документов можно использовать любые текстовые редакторы (Блокнот, Notepad, WordPad и др.), а также текстовые процессоры типа Word. Так, в MS Word97 легко и просто получить компактный гипертекстовый документ в формате “html”, выбрав для сохранения текстового документа именно этот тип формата. При этом не требуется знание HTML. В других последующих версиях того же MS Word также можно создавать подобные файлы, но при этом файл “обрастает” большим количеством порой совершенно ненужных тегов. В результате подобный файл, конечно же, можно использовать как веб-страницу и размещать на сайтах или порталах. Однако его размер становится в несколько раз больше оптимального. А это не очень хорошо, так как, во-первых, в несколько раз увеличится объём хранимых на сервере страниц сайта или портала. Во-вторых, что более важно, значительно возрастёт время загрузки таких станиц на компьютеры пользователей. Последнее обстоятельство вызывает у пользователей нежелание обращаться к таким сайтам и порталам.
Заметим, что увеличение времени загрузки страниц на компьютеры пользователей зависит и от других причин. Например, важно не перегружать страницы, особенно графическими и мультимедийными данными. Кроме того, замедление загрузки файлов возникают и по техническим причинам, включающим низкое быстродействие компьютера и модема пользователя, а также самой сети, подключение к которой предоставляет интернет-провайдер. Данного недостатка порой можно избежать путём выбора более надёжного провайдера, предоставляющего более быстрый канал связи.
Обычно же для создания гипертекстовых документов целесообразно использовать специальные программы, в которые по мере необходимости загружать материалы для веб-страниц, сделанные в других программах, например, текст из Word, табличные данные из Excel, а графические объекты из Photoshop и PowerPoint. Такие программы позволяют ускорить создание страниц за счёт автоматизации ряда простых рутинных процедур, например, создания шаблона страницы и таблиц, изменения стилей и размеров шрифтов, цвета, включения наиболее часто используемых тегов и т.д., а также возможности не переходя в другую программу периодически просматривать полученные результаты. В качестве специальных программ можно использовать, например, FrontPage, Publisher, Hot Dog, HomeSite, Reamweaver, Noteped, SiteCreate и др.
На смену HTML пришёл новый язык разметки документов – XML (eXtensible Markup Language). Прогнозируется, что использование этого языка позволит значительно упростить процессы взаимодействия между информационными системами, обеспечить эффективное управление предприятиями, использовать системы электронной коммерции и др.
В отличие от HTML, он ориентирован не на форматирование, а на данные. XML позволяет создавать оригинальные теги, поддерживать произвольную структуру данных и обеспечивать проверку корректности документа.
XML не связан с типом хранимых данных. Независимость от СУБД организуется путём представления запросов к ним на языке XML Query.
3. Информационные ресурсы Интернета
Под ресурсами Интернета ( англ. “Internet Resources”) понимается совокупность информационных запасов всей совокупности сетей, предоставляемых пользователю Интернета. Отметим, что к концу 2004 года в России насчитывалось около 15 млн., а в Москве – около двух млн. пользователей Интернета.
Цель размещения информационных ресурсов Интернета заключаться в качественном и оперативном предоставлении их пользователям, создании им возможности работы с разнообразной информацией, размещённой в различных регионах планеты. Для достижения этой цели, кроме создания эффективно действующих правовых механизмов, необходимо решить следующие задачи: классификации и систематизации обширной информации по отраслям знаний; определения способа нахождения необходимого пользователю ресурса. К сожалению, полной классификационной картины информационных ресурсов Интернета пока не существует, но исследования в этом направлении ведутся.
Предлагаются различные их деления. В Интернете множество видов информационных ресурсов, отличающихся: тематикой (по археологии, музыке и т. п.), направленностью, содержанием, доступностью или охватом предлагаемой пользователям информации (например, ресурсы правительства).
Тематические информационные ресурсы обычно отражают коллекции художественных произведений, стихов, фантастики, фотографий и др. Они могут включать много или несколько различных тем, а также быть посвящёнными одной проблеме и при этом затрагивать различные типы, виды, содержание и др. Кроме общепринятых, к ним следует отнести БД рефератов, курсовых и дипломных работ.
По виду информационные ресурсы Интернета можно разделить на: документы, аналогичные традиционным (документы, периодические издания, книги, брошюры и т.п.); графические изображения (картины, фотографии, диаграммы и т.п.); интерактивные (банеры и т.п.) и мультимедийные ресурсы (звук, видео, анимация).
По принадлежности и содержанию можно выделить: государственные (Правительства РФ и Субъектов Федерации), территориальные (региональные), политические, военные, общественные, научные, научно-технические, правовые, коммерческие, образовательные, художественные, СМИ (новости, ТВ), развлекательные, рекламные и иные информационные ресурсы.
Существуют информационные ресурсы, представляющие организации, учреждения, фирмы, в том числе библиотеки и информационные службы.
По назначению информационные ресурсы можно разделить на: возрастные, гетерогенные, национальные, религиозные, территориальные, коммерческие, производственные, технологические, учебные, туристические и спортивные, развлекательные, справочные и др.
Ряд информационных ресурсов трудно отнести к какому-либо виду, например, появившийся в 1994 году частный сайт “Библиотека Мошкова” (http://lib.ru), представляет значительные собрания условно систематизированных электронных документов, в большинстве художественного характера.
Информационные ресурсы в Интернете размещаются на серверах и представляют сайты, порталы (государственные, политические, общественные, коммерческие, религиозные, учебные, частные и иные) и БД.
Для поиска в Интернете широко используют поисковые системы (поисковые машины). Это специальный веб-сайт, на котором пользователь по заданному запросу может получить соответствующие ссылки на сайты и документы. Поисковая система состоит из: 1) поискового робота;
2) индекса системы;
3) программы, которая: обрабатывает запрос пользователя, находит в индексе документы, отвечающие критериям запроса, и выводит список найденных документов в порядке убывания релевантности.
В мире насчитывается 45 тыс. поисковых машин для открытого (“поверхностного”) Интернета. Среди множества поисковых отечественных и зарубежных машин, предоставляющих информационные ресурсы в Интернете, отметим: AltaVista, Google и Рамблер, Яндекс и другие.
В общем случае информация, представленная на сайтах и порталах в Интернете – потребительские информационные ресурсы. По мнению специалистов в сети на порядок больше документов, которые скрыты от широкого круга пользователей, что на 99% видимое содержание (контент) сайтов не представляет никакой ценности. Однако цели и назначение предлагаемых информационных ресурсов, а также интересы пользователей многогранны и разделяются по различным критериям.
Среди информационных ресурсов, ориентированных на большую аудиторию пользователей, совершенно очевидно выделяются средства массовой информации (СМИ).
СМИ достаточно быстро осознав преимущества и достоинства Интернета, активно ведут в нём различные виды деятельности. Важным аспектом представления пользователям публикаций являются создаваемые в Интернете электронные газеты и журналы. Они могут отражать материалы существующих печатных оригинальных изданий или быть полностью электронными, т.е. не имеющими печатных аналогов.
В середине 1995 года около 300 коммерческих газет работали или планировали работу с электронными видами услуг (из них 199 находились в США и 55 в Европе). Это электронные доски объявлений, электронные информационные службы (в том числе новостей), электронные газеты и сайты. Например, сайт Global Network Navogator (http://www.gnn.com) является одной из первых публикаций в WWW и содержит множество интересных соединений, путеводителей, тематических статей. New York Times (http://nytimesfax.com) – сетевой вариант газеты “New York Times”, а GAZETA.RU ( http://www.gazeta.ru) – электронная газета Российских политических новостей и т.д.
Одним из представителей электронных изданий, не имеющих печатных аналогов, является научный электронный журнал “Электронные библиотеки” (www.iis.ru/el-lib/).
Также многообразна развлекательная информация в Интернете. Кроме текстовых и графических данных, в Интернете можно слушать музыку, смотреть фильмы и мультфильмы, играть в игры и др.
Следует знать, что гипертекстовые технологии используются в информационных сетях, базирующихся на веб-технологиях. WWW (World Wide Web) – это глобальный механизм обмена информацией и популярная служба Интернета. Её основой являются HTTP и HTML, т.е. гипертекстовые технологии.
HTTP (Hyper Text Transfer Protocol) –транспортный протокол передачи гипертекстовых данных для связи веб-серверов и веб-клиентов, а HTML (Hyper Text Markup Language) – язык гипертекстовой разметки. Благодаря ему, можно не только формировать гипертекстовые документы, но осуществлять связь текста и изображения с документами, расположенными на другом веб-сервере и др. HTML использует механизм гиперссылок.
Гиперссылка или гиперсвязь (Hyperlink) – это фрагмент HTML-документа, указывающий на другой файл, который может быть расположен в Интернете или содержать полный путь к этому файлу. В качестве фрагментов или объектов могут быть представлены графические статические и динамические изображения, звук и др.
Гиперссылка для пользователя – это графическое изображение, текст на сайте или в письме электронной почты, устанавливающие связь и позволяющие переходить к другим объектам Интернета. При этом гипертекстовый документ – это файл, содержащий различные виды информации и имеющий в своей структуре гиперссылки на другие файлы или сам являющийся документом, на который есть ссылка в другом файле, расположенном на некотором сервере в любой точке планеты.
Гипертекстовый документ, размещённый на сервере с использованием WWW, называют Web-страницей (веб-страницей). Структура таких документов формируется с помощью последовательности тегов – элементов языка HTML, включающих тексты в формате ASCII. Тег или тэг (англ. “Tag” – метка) является признаком объекта, который управляет соответствующим кодом. Обычно тэги бывают парными, т.е. открывающими и закрывающими команду (дескриптор). Однако существуют операторы, не требующие их выключения (закрытия). Для указания признака объекта и (или) его состояния к тегам добавляются атрибуты и т.д.
На смену HTML пришёл новый язык разметки документов – XML (eXtensible Markup Language). Его использование позволит значительно упростить процессы взаимодействия между информационными системами, обеспечить эффективное управление предприятиями, использовать системы электронной коммерции и др.
Для создания гипертекстовых документов и веб-страниц применяют как обычное ПО, так и специальные программы. Важно при этом добиваться оптимальных (а лучше минимальных) размеров гипертекстовых файлов, чтобы сократить время на их загрузки на компьютер пользователя. Для решения этой же задачи, следует не перегружать страницы, особенно графическими и мультимедийными данными. Кроме того, замедление загрузки файлов возникают и по техническим причинам, включающим низкое быстродействие компьютера и модема пользователя, а также самой сети, подключение к которой предоставляет интернет-провайдер.
Для поиска в Интернете и просмотра найденных данных используют специальные программы-браузеры: Internet Explorer, Netscape Navigator, Opera и др.
Гипертекстовые технологии широко используются в настольных издательских системах, в системах управления документами (СУД), в системах подготовки электронных документов и др. Одним из перспективных направлений развития гипертекстовых систем является технология гипермедиа – соединение технологий гипертекста и мультимедиа (интеграция текста, графики, звука, видео). Гипертекстовые технологии способствовали созданию в информационных сетях информационных хранилищ, доступ к которым получают самые различные категории пользователей.
В результате в Интернете сформированы огромные и свободно доступные широким массам пользователей (открытые) самые разнообразные информационные ресурсы. В Интернете присутствует множество информационных ресурсов, отличающихся: тематикой (по археологии, музыке и т. п.), направленностью, содержанием, доступностью или охватом предлагаемой пользователям информации (например, ресурсы правительства). Они размещаются на серверах и представляют сайты, порталы (государственные, политические, общественные, коммерческие, религиозные, учебные, частные и иные) и БД.
Для поиска в Интернете широко используют специальные поисковые системы (поисковые машины): AltaVista, Google и Рамблер, Яндекс и другие.