Принцип работы поисковых систем




На серверах поисковых служб есть специальные программы (их называют роботами или пауками), которые собирают информацию в Интернете и возвращают на свой сервер все обнаруженные страницы. Из накопленной таким образом информации формируются базы, особым образом проиндексированные.

Основные задачи поисковых серверов:

n находить новые сайты и вносить их в собственную базу данных (хранилище) адресов;

n ранжировать сайты в базе данных и делать результаты поиска наиболее соответствующими запросам пользователей.

Поисковые системы стремятся предоставлять пользователям наиболее релевантные результаты поиска.

Примечание. Релевантность (от англ. relevancy) – степень соответ­ствия документа запросу. Релевантность документа запросу пользователя определяется в соответствии с заложенным в поисковую систему алгоритмом. Алгоритмы у поисковых систем разные, однако построены они на общих принципах, поэтому ищут поисковые системы примерно одинаково. Основные отличия поисковых серверов заключаются не в алгоритмах определения релевантности, а в способах их реализации и хранилищах адресов.

При вводе запросов (ключевых слов) в поисковые серверы пользователь надеется быстро получить ссылки на нужные ресурсы. А поисковые серверы, в свою очередь, конкурируют между собой за выдачу наиболее точных результатов.

Примечание. Если один из поисковых серверов не смог ничего найти по заданному запросу, то вам следует попробовать обратиться к другому поисковому серверу.

Когда поисковая система анализирует сайт, она «видит» только текст и не воспринимает дизайн сайта, количество картинок или анимацию. Таким образом, поисковая система оценивает только текст – сколько раз встречаются ключевые слова, как близко к началу страницы они находятся, в каких разделах веб-страницы встречаются.

Поисковые серверы обычно имеют специальный язык запросов, с помощью которого можно точнее объяснить, что именно надо искать. Однако, как правило, достаточно просто написать в строке запроса несколько ключевых слов, определяющих интересующую область. Сервер сам разберется, какие слова и словосочетания являются ключевыми.

Примечание. Практика показывает, что в настоящий момент пользователи слишком полагаются на несовершенные возможности поисковых серверов и в результате на запрос из одного-двух слов получают совершенно бесполезную для себя информацию.

Идеальный процесс поиска выглядит следующим образом:

1. Делаем общий запрос, вводя в поле поиска ключевые слова, и нажимаем кнопку Поиск.

2. Получив ответ с результатами, выделяем в нем описания наиболее подходящих ссылок.

3. Добавляем к прежнему запросу уточняющие ключевые слова, которые есть в описании нужных ссылок, и повторяем процесс.

 

Помимо описанного варианта поиска на многих сайтах можно воспользоваться поиском через тематические каталоги, в которых ссылки на сайты разделены по темам.

Если вы все делаете правильно, то каждый запрос приближает вас к нужной информации. Таким образом, с каждым шагом уменьшается несоответствие между нужной информацией и тем, что выдает поисковый сервер.

Например, вам необходимо найти расписание поездов, проходящих через Тулу. В качестве общего запроса в строке поиска можно попробовать указать поисковому серверу: «расписание всех поездов, проходящих через Тулу». Однако по такому запросу, к примеру, Яндекс находит лишь расписания поездов, проходящих через Самару, Санкт-Петербург, Калугу, но Тулы среди результатов поиска не видно. Это ни в коем случае не означает, что этой информации в базе поискового сервера нет, просто запрос был составлен не очень удачно.

Дело в том, что любая поисковая система старается найти веб-страницы, на которых находится максимальное количество слов из запроса, более того, если эти слова еще следуют друг за другом, то такие страницы будут выведены первыми. К примеру, если в тексте веб-страницы встречается фраза «расписание всех поездов, проходящих через Самару» (содержащая пять общих с запросом слов), то при отсутствии даже слова «Тула» система с большой вероятностью включит эту веб-страницу в список результатов, хотя она и не соответствует запросу. Поэтому нужно скорректировать запрос, убрав все лишние слова и оставив только те, которые точно характеризуют вашу потребность. В данном случае лишними словами являются «всех», «проходящих», «через», которые могут встречаться на каких угодно страницах. Задав исправленный запрос «расписание поездов Тула», вы точно получите то, что искали.

Большинство пользователей именно так и поступают, однако для того, чтобы быстро и эффективно находить нужную информацию, просто скорректировать запрос бывает недостаточно. Необходимо еще применять операторы языка запросов поискового сервера. Эти операторы помогают находить такую информацию, которую бывает сложно найти с помощью простых запросов. Далее рассмотрены операторы, общие для большинства поисковых серверов.

Один из таких операторов – оператор строгого соответствия; как правило, в современных поисковых системах это кавычки "". Сочетание слов, которое вы укажете в кавычках, будет учитываться сервером как единое целое, т.е. вы задаете порядок следования слов друг за другом.

Например, по запросу компьютерные журналы (без кавычек) можно получить в результатах поиска веб-страницы со словами, упоминающимися обособленно, т.е. на одной странице может быть слово «компьютерные», на другой – «журналы» и т.д. Конструкция же "компьютерные журналы" (в кавычках) заставляет поисковую систему отбросить все лишние страницы и показывать лишь те, на которых эти два слова идут друг за другом.

Еще два оператора – обязательного наличия слова «+» и обязательного отсутствия слова «-». Например, если вы хотите найти сайт журнала «Компьютерра», достаточно к запросу компьютерные журналы добавить +компьютера, т.е. получим "компьютерные журналы" +компьютерра. Если же нужно найти все журналы, кроме «Компьютерра», следует ввести "компьютерные журналы" -компьютерра.

Достаточно часто бывает необходимо, чтобы искомые ключевые слова содержались в пределах одного документа. Для этого следует использовать логический оператор И (AND). Однако во всех поисковых системах этого же результата можно достичь, поставив между словами обычный пробел. К примеру, запросы компьютерные журналы и компьютерные AND журналы, как правило, дадут один и тот же результат. Логический оператор ИЛИ (OR) позволяет найти страницы, содержащие хотя бы одно слово из запроса. Например, с помощью запроса компьютерные OR журналы можно найти документы, в которых встречается или слово «компьютерные», или слово «журналы».

Примечание. С языками запросов конкретного поискового сервера можно ознакомиться в его разделе помощи. Многие из серверов обладают собственными дополнительными операторами, которые могут пригодиться опытным пользователям.

Теперь приведем описания наиболее популярных поисковых служб.

Google

https://www.google.ru

Лидер поисковых машин Интернета, Google занимает более 70% мирового рынка. Cейчас служба регистрирует ежедневно около 50 млн поисковых запросов и индексирует более восьми миллиардов веб-страниц. Google может находить информацию на 105 языках.

Интерфейс Google содержит довольно сложный язык запросов, позволяющий ограничить область поиска отдельными доменами, языками, типами файлов и т.д.

Для простого поиска следует набрать нужное слово (или словосочетание) и нажать кнопку Поиск в Google (рис. 29.1).В результате появится список ссылок на найденные веб-ресурсы с их кратким описанием и выделением ключевых слов.

Рис. 29.1. Домашняя страница поискового сервера Google

В верхней строке данной страницы будет отображено количество найденных веб-ресурсов и время, потраченное на поиск.

Чтобы открыть тот или другой найденный веб-ресурс, который, по вашему мнению, может быть полезным, следует щелкнуть по соответствующей ссылке в списке.

В нижней части окна расположена область Страница результатов, которая позволяет, используя нажатие соответствующей цифры (2, 3, …), перейти на другие страницы со списком ссылок на найденные веб-страницы (рис. 29.2).

Рис. 29.2. Первая страница результатов поиска на сервере Google

Как правило, наиболее приемлемые результаты поиска содержатся лишь на первых нескольких страницах со списками ссылок на веб-сайты, т.к. на них размещаются ресурсы, которые включают все запрашиваемые ключевые слова.

Чтобы указать более точные критерии поиска, необходимо щелкнуть по пункту Расширенный поиск (находится справа от кнопки Поиск). В результате откроется страница (рис. 29.3), на которой можно указать точную фразу, любое искомое слово, отсутствующее слово, нужный язык искомых веб-страниц, режим поиска похожих страниц, количество отображаемых результатов на одной странице и др.

Пункт Настройки (рядом с пунктом Расширенный поиск) активирует страницу, в которой можно выбрать язык для подсказок и сообщений Google, язык страниц, поиск которых проводится (по умолчанию ищутся веб-страницы с любым языком), количество найденных сайтов на одной странице результатов (по умолчанию этот параметр равен 10).

Чтобы зафиксировать выполненные изменения параметров, надо нажать кнопку Сохранить параметры в правом нижнем углу страницы.

Рис. 29.3. Вид окна настройки параметров поиска в Google

Yandex

https://www.yandex.ru

По своей реализации этот популярный сервер имеет много общего с англоязычной системой Yahoo!

На главной странице сервера расположены ссылки на наиболее популярные поисковые категории: Работа, Развлечения, Спорт и т.п. (рис. 29.4).

Под названием категории указывается ее содержимое, причем открыть соответствующую подкатегорию выбранного раздела можно простым щелчком на ней. При этом под логотипом Яndex будет выведен полный путь к подкатегории, начиная с главной страницы. Каждый промежуточный уровень структуры доступен по отдельной ссылке. Справа от логотипа находится поисковая форма.

Поиск в каталоге реализован таким образом, что в результате запроса могут быть найдены как отдельные сайты, так и рубрики. В случае успешного поиска выводятся URL, название, описание, ключевые слова.

Рис. 29.4. Фрагмент главной страницы поискового сервера Yandex

Ссылки, помеченные символом @, приведут в подкатегории, структурно входящие в другие разделы, но содержащие близкую по содержанию информацию. Если вы хорошо представляете, в какой рубрике содержатся интересующие ресурсы, лучше перейти в нужную подкатегорию, воспользовавшись любым из предоставляемых средств навигации по каталогу. В противном случае можно искать их в полном списке. Каталог организован таким образом, что все сайты, содержащиеся на нижних уровнях структуры, представлены также в рубриках.

Показываемый в каталоге список ресурсов упорядочен в алфавитном порядке, но, выбрав соответствующую сортировку: По времени добавления или По переходам, можно просмотреть их по порядку добавления в каталог, начиная с самых «свежих», или в зависимости от популярности среди посетителей каталога. Ссылка с названием сайта открывает в отдельном окне его зарегистрированную в данной рубрике страницу. Пометки RUS и ENG означают наличие на сайте страниц на русском и английском языках соответственно.

Bing

https://www.bing.com

Bing – поисковая система компании Microsoft. До 1 июня 2009 она называлась Live Search и располагалась по следующему адресу: https://www.live.com.

В настоящее время Bing занимает третье место по полярности среди используемых поисковых систем. Система Bing имеет ряд уникальных особенностей, таких как возможность просмотра результатов поиска на одной веб-странице, возможность динамически корректировать объем информации, отображаемой для каждого результата поиска, а также содержит ежедневно изменяющиеся темы оформления стартовой страницы с информационными блоками.

Вверху страницы (или над строкой поиска) находятся пять кнопок, нажатием на которые вы сможете изменить тип отображения найденной информации на экране.

При поиске рисунков Bing отображает одну страницу с найденными результатами, а по мере прокручивания страницы просто подкачивает все найденные изображения, т.е. вам не нужно переключать страницы, чтобы просмотреть все результаты. Найденные изображения не подписаны; при наведении указателя мыши на заинтересовавшее вас изображение появится окошко с данными (адрес, расширение и т.п.).

Рис. 29.5. Главная страница поискового сервера Bing

Довольно интересно оформлен поиск видеоинформации. При наведении указателя мыши на эскиз запустится видео в режиме предпосмотра (рис. 29.6). Также можно отфильтровать найденные результаты по различным критериям, которые отображены в левой части окна.

Рис. 29.6. Фрагмент страницы Bing с видео

 


Ход работы

1. При помощи поисковой системы https://www.google.ru найдите все сайты содержащие слово Интернет. Сохраните результаты работы поисковой системы в ваш отчет.

2. При помощи поисковой системы https://www.yandex.ru найдите все сайты содержащие слово Интернет и сравните с результатами полученными в пункте 1. Сохраните результаты работы поисковой системы и результат сравнения в ваш отчет.

3. При помощи поисковой системы https://www.google.ru найдите словосочетание «Компьютерные сети». Сохраните результаты работы поисковой системы в ваш отчет.

4. При помощи поисковой системы https://www.google.ru найдите упоминание на одной странице словосочетаний «Компьютерные сети» и «Защита информации». Сохраните результаты работы поисковой системы в ваш отчет.

5. Найдите странице в сети интернет содержащие термин «Сеть» за исключением термина «Компьютерная сеть». Сохраните результаты работы поисковой системы в ваш отчет.

6. При помощи поисковой системы https://www.google.ru найдите все сайты содержащие изображение маршрутизаторов. Сохраните результаты работы поисковой системы в ваш отчет.

7. При помощи поисковой системы https://www.yandex.ru найдите все сайты содержащие изображение маршрутизаторов и сравните с результатами полученными в пункте 6. Сохраните результаты работы поисковой системы в ваш отчет.

8. Задайте свое место пребывания в поисковых системах https://www.google.ru и https://www.yandex.ru.

9. Произведите поиск дома с адресом ул. Академика Проскуры 1-а при помощи https://www.yandex.ru с отображением найденного результата на карте города. Сохраните результаты работы поисковой системы в ваш отчет.

10. Произведите поиск дома с адресом ул. Академика Проскуры 1-а при помощи https://www.google.ru с отображением найденного результата на карте города. Сохраните результаты работы поисковой системы в ваш отчет.

11. Найдите страницы находящиеся в харьковском регионе и содержащее словосочетание «Интернет-магазин» при помощи https://www.google.ru Сохраните результаты работы поисковой системы в ваш отчет.

12. Найдите страницы находящиеся в харьковском регионе и содержащее словосочетание «Интернет-магазин» при помощи https://www.yandex.ru Сохраните результаты работы поисковой системы в ваш отчет.

13. Сравните результаты работы поисковых систем в пункте 11 и 12.

14. Проведите поиск сайтов содержащих словосочетания «Аппаратное обеспечение» которые обновлялись в течение последних 6 месяцев при помощи поисковых систем https://www.yandex.ru и https://www.google.ru. Сохраните результаты работы поисковых системы в ваш отчет. Сравните результаты работы поисковых систем https://www.yandex.ru и https://www.google.ru.

15. При помощи поисковой системы https://www.google.ru проведите поиск новостей по словосочетанию «социальные сети». Сохраните результаты работы поисковой системы в ваш отчет.

16. При помощи поисковой системы https://www.bing.com проведите поиск видеоинформации по словосочетанию «ХНУВС». Сохраните результаты работы поисковой системы в ваш отчет.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2020-11-02 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: