Поиск информации (документов, файлов, людей)

Сеть Интернет растет очень быстрыми темпами, и найти нужную информацию среди сотен миллионов Web-страниц и файлов становится все сложнее. Для поиска информации используются специальные поисковые серверы, которые содержат более или менее полную и постоянно обновляемую информацию о Web-страницах, файлах и других документах, хранящихся на десятках миллионов серверов Интернета.

Различные поисковые серверы могут использовать различные механизмы поиска, хранения и предоставления пользователю информации. Поисковые серверы Интернета можно разделить на две группы:

- поисковые системы общего назначения;

- специализированные поисковые системы.

Поисковые системы общего назначения являются базами данных, содержащими тематически сгруппированную информацию об информационных ресурсах Всемирной паутины. Такие поисковые системы позволяют находить Web-сайты или Web-страницы по ключевым словам в базе данных или путем поиска в иерархической системе каталогов.

Наиболее мощными поисковыми системами общего назначения в русскоязычной части Интернета являются серверы Rambler (https://www.rambler.ru), Апорт (https://www.aport.ru), и Яндех (https://www.yandex.ru), а по всему Интернету - сервер Yahoo (https://www.yahoo.com).

Заполнение баз данных осуществляется с помощью специальных программ-роботов, которые периодически «обходят» Web-сервера Интернета. Программы-роботы читают все встречающиеся документы, выделяют в них ключевые слова и заносят в базу данных, содержащую URL-адреса документов.

Так как информация в Интернете постоянно меняется (создаются новые Web-сайты и страницы, удаляются старые, меняются их URL-адреса и т.д.), поисковые роботы не всегда успевают отследить все эти изменения. Информация, хранящаяся в базе данных поисковой системы, может отличаться от реального состояния Интернета, и тогда пользователь в результате поиска может получить адрес уже не существующего или перемещенного документа.

В целях обеспечения большего соответствия между содержанием базы данных поисковой системы и реальным состоянием Интернета большинство поисковых систем разрешают автору нового или перемещенного Web-сайта самому внести информацию в базу данных, заполнив регистрационную анкету. В процессе заполнения анкеты разработчик сайта вносит URL-сайта, его название, краткое описание содержания сайта, а также ключевые слова, по которым легче всего будет найти сайт.

Интерфейс таких поисковых систем общего назначения содержит список разделов каталога и поле поиска. В поле поиска пользователь может ввести ключевые слова для поиска документа, а в каталоге выбрать определенный раздел, что сужает поле поиска и таким образом ускоряет его. Простой запрос содержит в поле поиска одно или несколько ключевых слов, которые, по вашему мнению, являются главными для этого документа. Можно также делать сложные запросы, использующие логические операции, шаблоны и т.д.

Через некоторое время после отправки запроса поисковая система вернет аннотированный список URL-адресов документов, в которых были найдены указанные вами ключевые слова. Для просмотра этого документа в браузере достаточно активизировать указывающую на него ссылку.

Если ключевые слова были выбраны неудачно, то список URL-адресов документов может быть слишком большим (может содержать десятки и даже сотни тысяч ссылок). Для того чтобы уменьшить список, можно в поле поиска ввести дополнительные ключевые слова или воспользоваться каталогом поисковой системы.

Web-сайты в базе данных поисковой системы группируются в тематические каталоги - аналоги тематического указателя в библиотеке. Тематические разделы верхнего уровня, например, «Интернет», «Компьютеры», «Культура и искусство» и т.д., содержат вложенные каталоги. Например, каталог «Интернет» может содержать подкаталоги «Провайдеры», «Поиск», «Общение» и др.

Поиск информации сводится к выбору определенного каталога, после чего пользователю будет представлен список ссылок на URL-адреса наиболее посещаемых и важных Web-сайтов и Web-страниц. Каждая ссылка обычно аннотирована, т.е. содержит короткий комментарий к содержанию документа.

Специализированные поисковые системы позволяют искать информацию в других информационных «слоях» Интернета: серверах файловых архивов, почтовых серверах и др.

Для поиска файлов на серверах файловых архивов существуют специализированные поисковые системы двух типов: поисковые системы на основе использования баз данных и каталоги файлов. Для поиска файла в системе с использованием базы данных достаточно ввести имя файла в поле поиска, и поисковая система выдаст URL-адреса мест хранения данного файла.

Для поиска необходимых файлов можно использовать систему серверов Archie, которые собирают и хранят поисковую информацию о содержимом FTP-серверов на узлах Интернета.

Специализированные поисковые системы позволяют искать адрес электронной почты по имени человека или, наоборот, имя человека, хозяина определённого адреса электронной почты. Примером такой системы может служить поисковая система WhoWhere? (КтоГде?), расположенная по адресу: https://www.whowhere.com.

Найти Web-страницу или файл в Интернете можно с помощью универсального указателя ресурсов (адреса Web-страницы). Универсальный указатель ресурсов (URL - Universal Resource Locator) включает в себя протокол доступа к документу, доменное имя или IP-адрес сервера, на котором находится документ, а также путь к файлу и собственно имя файла. Например: https://schools.keldysh.ru/info2000/index.htm состоит из трех частей: https:// - протокол доступа; schools.keldysh.ru - имя сервера; /info2000/index.htm - путь к файлу и имя файла.

2.7.6. Разработка сайтов (основы HTML)

Создание Web-сайтов реализуется с помощью языка разметки гипертекстовых документов HTML (Hyper Text Markup Language). Технология HTML состоит в том, что в обычный текстовый документ вставляют управляющие символы (тэги) и в результате получают Web-страницу. Браузер при загрузке Web-страницы представляет ее на экране в том виде, который задается тэгами.
Некоторые тэги имеют атрибуты, определяющие свойства тэга. Атрибут - это имя свойства, которое может принимать определенные значения.

Для создания Web-страниц служат простейшие текстовые редакторы, которые не включают в создаваемый документ управляющие символы форматирования текста. В качестве такого редактора в Windows можно использовать стандартное приложение Блокнот.

HTML-код страницы помещается внутрь контейнера <HTML></HTML>. Без этих тэгов браузер не в состоянии определить формат документа и правильно его интерпретировать. Web-страница разделяется на две логические части: заголовок и содержание.

Заголовок Web-страницы заключается в контейнер <HEAD></HEAD> и содержит справочную информацию о странице, которая используется браузером для её правильного отображения.

Название Web-страницы содержится в контейнере <TITLE></TITLE>и отображается при её просмотре в строке заголовка браузера.

Основное содержание страницы помещается в контейнер<BODY></BODY>, и в него могут входить текст, графические изображения, таблицы, бегущие строки, звуковые файлы и т.д.

С помощью HTML-тэгов определяют различные параметры форматирования текста. Заголовок страницы целесообразно выделить крупным шрифтом. Размер шрифта заголовка устанавливается тэгами от <H1> (самый крупный) до <H6> (самый мелкий).

Текст по умолчанию выравнивается по левому краю страницы. Однако заголовок обычно принято размещать по центру страницы (в данном случае - окна браузера). Сделать это нам позволяет атрибут ALIGN, которому требуется присвоить определённое значение, например ALGIN=”center”.

С помощью тэга FONT и его атрибутов можно задать параметры форматирования шрифта любого фрагмента текста. Изменить цвет шрифта, например на синий, можно с помощью тэга, задающего шрифт с атрибутом цвета: <FONT COLOR=”blue”>.

Заголовок целесообразно отделить от остального содержания страницы горизонтальной линией с помощью одиночного тэга <HR>

В Web-сайтах могут размещаться изображения в трех графических форматах - GIF, JPG и PNG. Для вставки изображения используется тэг IMG с атрибутом SRС="имя файла".
Пользователи иногда в целях экономии времени отключают в браузере загрузку графических изображений и читают только тексты. Поэтому, чтобы не терялся смысл и функциональность страницы, вместо рисунка следует выводить поясняющую надпись. Для этого тэг IMG имеет еще один атрибут ALT, значением которого является поясняющая надпись.

Для создания гипертекстовых страниц можно воспользоваться специальным гипертекстовым редактором.

Поиск информации (документов, файлов, людей)

Поиск по сайту