Поисковая система – это программно-аппаратный комплекс, с помощью которого осуществляется поиск в сети Интернет, введя туда пользователем поисковый запрос в виде текста, который является ключевой фразой, ПС отображает сайты (ссылки на сайты) по релевантности с точки зрения самого поисковика (в соответствии запроса). Самой популярной поисковой системой в мире является – Google. В Рунете это – Яндекс.
Основной задачей всех Поисковых систем – это доставлять пользователям, искомую ими информацию в интернете, и т.к. люди не могут подстраиваться под алгоритмы и принципы работы поисковых систем, разработчики делают поисковики максимально удобными и подстраивают их на работу пользователей.
Это значит, что поисковая система должна «думать» также как думает пользователь, который в свою очередь пытается найти информацию. И когда пользователь вводит поисковый запрос в поисковой машине, он желает найти то, что хочет, то, что ему нужно, максимально быстро и просто.
Основные характеристики поисковых систем.
· Полнота
Полнота – это одна из важнейших характеристик поисковых систем, она нацелена на количество найденной информации в сети интернет из всей присутствующей информации по какому-либо запросу пользователя. Т.е. допустим, мы ввели в строку поиска «Купить холодильник» и в Интернете содержится 200 страниц с этой ключевой фразой, а поисковик выдал нам всего 100 страниц, значит, полнота поиска составит 0.5%. Исходя из такого принципа работы поисковиков, мы можем сделать вывод, что чем больше Полнота поиска, тем меньше шанс у пользователя не найти интересующую его информацию в интернете.
· Точность
Точность – эта характеристика служит для определения степени соответствия найденных ресурсов по запросу пользователя. Т.е. если мы введем в строку поиска «Как выбрать велосипед» и поисковик выдаст нам 200 страниц содержащих ссылки на сайты с этим ключевым словом, и среди них 120 страниц будут конкретно содержать фразу «Как выбрать велосипед». А в остальных 80 страницах просто будут присутствовать слова из ключевой фразы, например: «Как правильно выбрать спидометр и поставить его на велосипед», то точность поискового запроса составит 0.6%. Следовательно, чем точнее поиск, тем быстрее пользователь найдет нужную ему информацию, тем меньше запросов будут не соответствовать поисковому запросу.
|
· Актуальность
Актуальность определяется временем, которое в свою очередь определяется с момента публикации статьи в Интернете, до того момента, как она попадет в индексную базу поисковых систем, т.е. проиндексируется поисковиками. Например, вы написали и опубликовали статью на своем сайта, на следующий день поисковые системы ее проиндексировали и добавили в поиск. Уже через день многие пользователи пытаются найти соответствующую информацию в интернете, и благодаря тому, что ваша статья уже прошла индексирование и добавилась в поисковую выдачу запросов, она высветится в поисковой выдаче запроса пользователя.
· Скорость поиска
Скорость поиска тесно связано с устойчивостью к нагрузкам. В этой характеристике интересы поисковых систем и интересы пользователей полностью совпадают, потому что Пользователи хотят быстрее получить результаты поиска, а поисковые системы хотят как можно быстрее обработать поисковую фразу и выдать список ресурсов, содержащих эту ключевую фразу и переходить на работу с другими поисковыми фразами.
|
· Наглядность
Как мы же можем обойтись без наглядности, без просмотра информации. Наглядность показа результатов играет немало важную роль в удобном поиске. Ведь не всегда мы можем найти интересующую нас информацию даже в первых позициях поисковой выдаче, иногда приходится пройтись по нескольким сайтам в поисковой выдаче, чтобы найти нужную информацию. Поэтому нам приходится, кроме того, чтобы ввести ключевую фразу в поисковую систему, самостоятельно пройтись по ссылкам, ведущим на сайт с информацией и найти именно нужную нас информацию. Это значит, что пользователям очень часто приходится делать свой поиск среди найденного списка ПС.
Поисковая система состоит из трех основных элементов это Модуль индексирования, База данных и Поисковый сервер. Сейчас мы разберем каждый из них и посмотрим, из чего собственно они состоят.
Модуль индексирования содержит в себе или сказать по-другому, состоит из трех программ, которые по-другому еще называют поисковые роботы.
База данных или по-другому индекс поисковой системы – это такая система хранения данных, в которой хранится вся скаченная и проиндексированная информация с веб-ресурсов.
Поисковый сервер – это важнейший элемент всей поисковой системы, т.к. от алгоритмов, которые находятся в основе ее функционирования, напрямую зависит качество и скорость поиска.