Поиск информации (документов, файлов, людей)




Сеть Интернет растет очень быстрыми темпами, и найти нужную информацию среди сотен миллионов Web-страниц и файлов становится все сложнее. Для поиска информации используются специальные поисковые серверы, которые со­держат более или менее полную и постоянно обновляемую информацию о Web-страницах, файлах и других докумен­тах, хранящихся на десятках миллионов серверов Интернета.

Различные поисковые серверы могут использовать различ­ные механизмы поиска, хранения и предоставления пользо­вателю информации. Поисковые серверы Интернета можно разделить на две группы:

- поисковые системы общего назначения;

- специализированные поисковые системы.

Поисковые сис­темы общего назначения являются базами данных, содержа­щими тематически сгруппированную информацию об ин­формационных ресурсах Всемирной паутины. Такие поисковые системы позволяют находить Web-сайты или Web-страницы по ключевым словам в базе данных или пу­тем поиска в иерархической системе каталогов.

Наиболее мощными поисковыми системами общего на­значения в русскоязычной части Интернета являются серве­ры Rambler (https://www.rambler.ru), Апорт (https://www.aport.ru), и Яндех (https://www.yandex.ru), а по всему Интернету - сервер Yahoo (https://www.yahoo.com).

Заполнение баз данных осуществляется с помощью спе­циальных программ-роботов, которые периодически «обхо­дят» Web-сервера Интернета. Программы-роботы читают все встречающиеся документы, выделяют в них ключевые слова и заносят в базу данных, содержащую URL-адреса докумен­тов.

Так как информация в Интернете постоянно меняется (создаются новые Web-сайты и страницы, удаляются ста­рые, меняются их URL-адреса и т.д.), поисковые роботы не всегда успевают отследить все эти изменения. Информация, хранящаяся в базе данных поисковой системы, может отли­чаться от реального состояния Интернета, и тогда пользова­тель в результате поиска может получить адрес уже не су­ществующего или перемещенного документа.

В целях обеспечения большего соответствия между содер­жанием базы данных поисковой системы и реальным состо­янием Интернета большинство поисковых систем разреша­ют автору нового или перемещенного Web-сайта самому внести информацию в базу данных, заполнив регистрацион­ную анкету. В процессе заполнения анкеты разработчик сайта вносит URL-сайта, его название, краткое описание содер­жания сайта, а также ключевые слова, по которым легче всего будет найти сайт.

Интерфейс таких поисковых систем общего назначения содержит список разделов каталога и поле поиска. В поле поиска пользователь может ввести ключевые слова для по­иска документа, а в каталоге выбрать определенный раздел, что сужает поле поиска и таким образом ускоряет его. Про­стой запрос содержит в поле поиска одно или несколько ключевых слов, которые, по вашему мнению, являются главными для этого документа. Можно также делать слож­ные запросы, использующие логические операции, шаблоны и т.д.

Через некоторое время после отправки запроса поисковая система вернет аннотированный список URL-адресов доку­ментов, в которых были найдены указанные вами ключевые слова. Для просмотра этого документа в браузере достаточно активизировать указывающую на него ссылку.

Если ключевые слова были выбраны неудачно, то список URL-адресов документов может быть слишком большим (может содержать десятки и даже сотни тысяч ссылок). Для того чтобы уменьшить список, можно в поле поиска ввести дополнительные ключевые слова или воспользоваться ката­логом поисковой системы.

Web-сайты в базе данных поисковой системы группиру­ются в тематические каталоги - аналоги тематического указателя в библиотеке. Тематические разделы верхнего уровня, например, «Интернет», «Компьютеры», «Культура и искусство» и т.д., содержат вложенные каталоги. Напри­мер, каталог «Интернет» может содержать подкаталоги «Провайдеры», «Поиск», «Общение» и др.

Поиск информации сводится к выбору определенного ка­талога, после чего пользователю будет представлен список ссылок на URL-адреса наиболее посещаемых и важных Web-сайтов и Web-страниц. Каждая ссылка обычно анноти­рована, т.е. содержит короткий комментарий к содержанию документа.

Специализированные поисковые системы позволяют ис­кать информацию в других информационных «слоях» Интернета: серверах файловых архивов, почтовых серверах и др.

Для поиска файлов на серверах файло­вых архивов существуют специализированные поисковые системы двух типов: поисковые системы на основе использо­вания баз данных и каталоги файлов. Для поиска файла в системе с использованием базы данных достаточно ввести имя файла в поле поиска, и поисковая система выдаст URL-адреса мест хранения данного файла.

Для поиска необходимых файлов можно использовать систему серверов Archie, которые собирают и хранят поисковую информацию о содержимом FTP-серверов на узлах Интернета.

Специализированные поисковые системы позволяют искать адрес электронной почты по имени человека или, наоборот, имя человека, хозяина определённого адреса электронной почты. Примером такой системы может служить поисковая система WhoWhere? (КтоГде?), расположенная по адресу: https://www.whowhere.com.

Найти Web-страницу или файл в Интернете можно с помощью универсального указателя ресурсов (адреса Web-страницы). Универсальный указатель ресурсов (URL - Universal Resource Locator) включает в себя протокол доступа к документу, доменное имя или IP-адрес сервера, на котором находится документ, а также путь к файлу и собственно имя файла. Например: https://schools.keldysh.ru/info2000/index.htm состоит из трех частей: https:// - протокол доступа; schools.keldysh.ru - имя сервера; /info2000/index.htm - путь к файлу и имя файла.

 


2.7.6. Разработка сайтов (основы HTML)

 

Создание Web-сайтов реализуется с помощью языка разметки гипертекстовых документов HTML (Hyper Text Markup Language). Технология HTML состоит в том, что в обычный текстовый документ вставляют управляющие символы (тэги) и в результате получают Web-страницу. Браузер при загрузке Web-страницы представляет ее на экране в том виде, который задается тэгами.
Некоторые тэги имеют атрибуты, определяющие свойства тэга. Атрибут - это имя свойства, которое может принимать определенные значения.

Для создания Web-страниц служат простейшие текстовые редакторы, которые не включают в создаваемый документ управляющие символы форматирования текста. В качестве такого редактора в Windows можно использовать стандартное приложение Блокнот.

HTML-код страницы помещается внутрь контейнера <HTML></HTML>. Без этих тэгов браузер не в состоянии определить формат документа и правильно его интерпретировать. Web-страница разделяется на две логические части: заголовок и содержание.

Заголовок Web-страницы заключается в контейнер <HEAD></HEAD> и содержит справочную информацию о странице, которая используется браузером для её правильного отображения.

Название Web-страницы содержится в контейнере <TITLE></TITLE>и отображается при её просмотре в строке заголовка браузера.

Основное содержание страницы помещается в контейнер<BODY></BODY>, и в него могут входить текст, графические изображения, таблицы, бегущие строки, звуковые файлы и т.д.

С помощью HTML-тэгов определяют различные параметры форматирования текста. Заголовок страницы целесообразно выделить крупным шрифтом. Размер шрифта заголовка устанавливается тэгами от <H1> (самый крупный) до <H6> (самый мелкий).

Текст по умолчанию выравнивается по левому краю страницы. Однако заголовок обычно принято размещать по центру страницы (в данном случае - окна браузера). Сделать это нам позволяет атрибут ALIGN, которому требуется присвоить определённое значение, например ALGIN=”center”.

С помощью тэга FONT и его атрибутов можно задать параметры форматирования шрифта любого фрагмента текста. Изменить цвет шрифта, например на синий, можно с помощью тэга, задающего шрифт с атрибутом цвета: <FONT COLOR=”blue”>.

Заголовок целесообразно отделить от остального содержания страницы горизонтальной линией с помощью одиночного тэга <HR>

В Web-сайтах могут размещаться изображения в трех графических форматах - GIF, JPG и PNG. Для вставки изображения используется тэг IMG с атрибутом SRС="имя файла".
Пользователи иногда в целях экономии времени отключают в браузере загрузку графических изображений и читают только тексты. Поэтому, чтобы не терялся смысл и функциональность страницы, вместо рисунка следует выводить поясняющую надпись. Для этого тэг IMG имеет еще один атрибут ALT, значением которого является поясняющая надпись.

Для создания гипертекстовых страниц можно воспользоваться специальным гипертекстовым редактором.

 

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2019-04-14 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: