Поисковые системы в Интернет




"Всемирная паутина" в Интернет - это миллионы документов с неструктурированной текстовой информацией (а также с графикой, аудио, видео). Чтобы найти нужную информацию, клиенту сети зачастую приходиться перебирать сотни страниц Web (иногда без особого успеха), тратить много сил и нервов (а также денежных средств).

Средствами для нахождения информации в Интернете являются справочно-поисковые системы. Все существующие типы справочно-поисковых систем в Интернете могут быть разделены на следующие группы:

системы Web-поиска;

системы поиска FTP-файлов;

системы поиска в архивах Gopher;

системы поиска в Usenet;

каталоги;

порталы.

Каждая поисковая система индексирует страницы серверов особым способом, приоритеты в поиске по индексам тоже отличаются от других систем, поэтому запрос по ключевым словам и выражениям в каждой из поисковых систем может дать разные результаты.

6.1 Archie

Archieпредставляет собой комплекс программных средств, работающих со специальными базами данных. В этих базах данных содержится постоянно пополняющаяся информация о файлах, к которым можно получить доступ через сервис FTP. Пользуясь услугами системы Archie, можно осуществить поиск файла по шаблону его имени. При этом пользователь получит список файлов с точным указанием места их хранения в сети, а также с информацией о типе, времени создания и размере файлов. Доступ к информационно-поисковой системе Archie может осуществляться различными путями, начиная от запросов по электронной почте и с помощью сервиса Telnet и заканчивая использованием графических Archie-клиентов.

6.2 Gopher

Gopher - наиболее широко распространенное средство поиска информации в сети Internet, позволяющее находить информацию по ключевым словам и фразам. Работа с системой Gopher напоминает просмотр оглавления, при этом пользователю предлагается пройти сквозь ряд вложенных меню и выбрать нужную тему. В Internet в настоящее время свыше 2000 Gopher-систем, часть из которых является узкоспециализированной, а часть содержит более разностороннюю информацию.

Gopher позволяет получить информацию без указания имен и адресов авторов, благодаря чему пользователь не тратит много времени и нервов. Он просто сообщит системе Gopher, что именно ему нужно, и система находит соответствующие данные. Gopher-серверов свыше двух тысяч, поэтому с их помощью не всегда просто найти требуемую информацию. В случае возникших затруднений можно воспользоваться службой VERONICA. VERONICA осуществляет поиск более чем в 500 системах Gopher, освобождая пользователя от необходимости просматривать их вручную. В настоящий время специализированные программы-клиенты GOPHER не используется, так как современные браузеры обеспечивают доступ к серверам GOPHER.

6.3 WAIS

WAIS - еще более мощное средство получения информации, чем Gopher, поскольку оно осуществляет поиск ключевых слов во всех текстах документов. Запросы посылаются в WAIS на упрощенном английском языке.

Это значительно легче, чем формулировать их на языке алгебры логики, и это делает WAIS более привлекательной для пользователей-непрофессионалов.

При работе с WAIS пользователям не нужно тратить много времени, чтобы найти необходимые им материалы.

В сети Internet существует более 200 WAIS - библиотек. Но поскольку информация представляется преимущественно сотрудниками академических организаций на добровольных началах, большая часть материалов относится к области исследований и компьютерных наук.

В универсальных службах используется обычный принцип поиска в неструктурированных документах - по ключевым словам.

Ключевым словом документа называется отдельное слово или словосочетание, которое каким-то образом отражает содержание данного документа. Универсальная служба поиска (поисковая система) - это комплекс программ и мощных компьютеров, выполняющих следующие функции:

1. Специальная программа (поисковый робот) непрерывно просматривает страницы "Всемирной паутины", выбирает ключевые слова и адреса документов, в которых эти слова обнаружены. Здесь уместно упомянуть об индексированном файле. Отдельный файл, содержащий информацию о физическом расположении записей в каком-либо файле базы данных. Вместо этого, чтобы просматривать фактический файл базы данных, программы базы данных пользуются индексами, что позволяет существенно ускорить поиск нужной информации.

2. Web - сервер принимает от пользователя запрос на поиск, преобразует его и передает специальной программе - поисковой машине.

3. Поисковая машина просматривает базу данных индексов, составляет список страниц, удовлетворяющим условиям запроса (точнее список ссылок на эти страницы) и возвращает его Web - серверу.

4. Web - сервер оформляет результаты выполнения запроса в удобном для пользователя виде и передает их на машину клиента.

Среди наиболее известных и мощных поисковых систем: Google, Yahoo,Lycos.

Поиск графической информации (в том числе и видеоинформации) - пока принципиально неразрешимый вопрос в компьютерной технологии.

Специализированные справочные службы - это тематические каталоги (subject catalogs), в которых собраны более или менее структурированные сведения об адресах серверов по той или иной тематике. В отличие от универсальных баз индексов, тематические каталоги составляются специалистами и обеспечивают клиента более строгой, достоверной систематизированной информацией о Сети.

Кроме того, многие сайты Интернет располагают собственными механизмами поиска (в пределах данного сайта). В первую очередь это механизм контекстного поиска, а также специализированный поиск по фамилиям (например, персоны компьютерного бизнеса), товарам (рекламные сайты), фирмам и т.д. Контекстный поиск на текущей странице предусмотрен и в Internet Explorer.

Некоторые страницы в Internet (например, страницы поисковых систем) специально предназначены для приема и обработки запросов на поиск. Microsoft в Internet Explorer предлагает собственную страницу поиска.

Internet Explorer не занимается поиском: он принимает от пользователя запрос, обрабатывает его и передает соответствующей поисковой системе.

Например, если нужно вести поиск средствами Alfa Vista, надо набрать текст запроса в поле ввода Alfa Vista и нажать кнопку "Поиск". Как сформировать запрос? В основе запросов на поиск и выборку информации лежит аппарат алгебры логики. Однако поиск в Интернет гораздо менее формализован, чем в структурированных базах данных.

В качестве примера рассмотрим некоторые запросы в Alfa Vista. Простейший запрос - отобрать страницы в Интернет, который содержит заданное слово, например "Информатика". Если запрос состоит из нескольких слов, то в Alfa Vista предусмотрены следующие соглашения.

1. Несколько слов, выбранных через пробел, обозначают запрос, соответствующий логической операции ОК (ИЛИ). Например, по запросу школьная информатика будут оформлены страницы, на которых имеется или "Школьная" или "Информатика" (или сразу оба слова). Число таких документов очень велико: в них могут попасть страницы, не имеющие никакого отношения к информатике.

2. Несколько слов, заключенных в кавычки, воспринимаются системой как единое целое. Например, по запросу "Школьная информатика" будут отобраны документы, в которых имеется эта символьная строка.

Слова, соединенные знаком "+" (плюс), соответствуют логической операции AKD (И). Например, по запросу Школьная + Информатика будут отобраны документы, в которых содержаться оба этих слова. Ясно, что число таких документов будет не меньше числа документов, отобранных по второму запросу.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2019-12-18 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: