Приемы поиска в системе «Yandex»




Методическая разработка

для студентов педиатрического факультета

к практическому занятию по теме

«Средства сети Интернет для поиска профессиональной информации по отдельным разделам медицинских знаний. Поисковые системы»

1. Научно-методическое обоснование темы:

Одним из основных способов найти информацию в Интернете являются поисковые системы. Материалы для размещения в Сети готовят живые люди, поэтому там можно найти только то, что опубликовано. Сегодня в Интернете около двух миллиардов страниц. В результате каталогизация имеющихся в Сети ресурсов стала серьёзной проблемой. Несмотря на то, что каталогизацией занимаются тысячи организаций, проблема не приближается к разрешению, а становится ещё острее. Пространство Web быстрее наполняется, чем систематизируется. Любая книга начинается с Содержания и заканчивается Алфавитным указателем. Содержание – это пример каталогизации. Читатель выбирает тему и находит страницу, где эта тема раскрывается. Алфавитный указатель – это пример индексации. Читатель находит в указателе нужный термин и получает номер страницы, на которой он встречается. В Интернете над каталогами работают люди, а указатели формируются автоматически. При каталогизации ресурса опытный редактор внимательно просматривает его, определяет, к какой области знаний относится данный ресурс, устанавливает его категорию в этой отрасли и вносит ресурс в каталог. Самый крупный каталог Интернета – yahoo (www.yahoo.com). В нем работают более 150 квалифицированных редакторов.

 

2. Краткая теория:

1. Поисковые указатели

Поисковые указатели – это автоматизированные системы. Они способны функционировать без участия человека, и потому их знание о подлинных ресурсах Сети намного больше. Количество проиндексированных Web – страниц может измеряться сотнями миллионов. Работа поискового указателя происходит в три этапа, из который два первых являются подготовительными и незаметны для пользователя. Сначала поисковый указатель собирает всю информацию из World Wide Web и использует для этой цели специальные программы, аналогичные браузерам. Заданные страницы копируются на сервер поискового указателя, затем находятся все гиперссылки, которые на ней имеются, по указанным в них URL – адресам, и копируются найденные там ресурсы и т. д.

После копирования разысканных Web – ресурсов на сервер поисковой системы начинается второй этап работы - индексация. Индексированная база данных – это своего рода словарь. Она необходима для того, чтобы поисковая система могла очень быстро отвечать на запросы пользователей. Современные системы выдают ответы за доли секунды.

На третьем этапе происходит обработка запроса клиента и выдача ему результатов поиска в виде списка гиперссылок. Этими ссылками можно пользоваться для перехода к интересующим ресурсам. Например, достаточно ввести в поле поиска слово футбол, и российская поисковая система выдаст несколько тысяч ссылок, сгруппировав их по 10 – 20 штук на отображаемой странице. Пользователю необходимо, чтобы в первом десятке шли ссылки, актуальные на данный момент, очень раздражает, если подряд идут ссылки на соседние файлы одного и того же сервера. Самый плохой вариант, когда подряд идут несколько ссылок, ведущих к одному и тому ресурсу, но находящемуся на разных серверах.

Все поисковые системы черпают исходную информацию из одного и того же Web – пространства, поэтому исходные базы данных у них могут быть относительно похожи, но на третьем этапе, при выдаче результатов поиска, проявляются её лучшие индивидуальные черты. Операция сортировки полученных результатов называется ранжированием. Каждой найденной Web – странице, система присваивает какой – то рейтинг, который должен отражать качество материала. Высокие рейтинги получают страницы, у которых ключевое слово, использованное в запросе, входит в заголовок. Уровень рейтинга повышается, если это слово встречается на Web - странице несколько раз, но не слишком часто. Благоприятно влияет на рейтинг вхождение нужного слова в первые 5 – 6 абзацев текста – они считаются самыми важными при индексации.

Очень хорошо, если ключевые слова, использованные в запросе, входят в альтернативный текст, сопровождающий иллюстрации. Для поисковой системы это верный признак того, что данная страница точно соответствует запросу. Ещё одним признаком качества Web–страниц является тот факт, что на неё есть ссылки с каких – то других Web – страниц. Значит эта Web – страница популярна и обладает высоким показателем цитирования.

Необходимость в ранжировании результатов поиска очевидна. Без этого клиенты захлебнулись бы в потоке предлагаемых ссылок. Однако, есть и негативная сторона: у каждой поисковой системы своя политика ранжирования и не исключено, что взгляды создателей поисковой системы не вполне совпадают со взглядами клиента.

Прежде чем приступить к поиску, необходимо четко сформулировать цель поиска, а также попробовать подобрать всевозможные словоформы и другие варианты формулировки запроса. Это может в ряде случаев значительно ускорить поиск, а также даст гораздо больше вариантов, из которых уже можно будет выбрать наиболее подходящий. Кроме того, если Вы заранее знаете какой фирме, компании или организации принадлежит интересующий ресурс, можно попробовать зайти на официальную страницу этой фирмы. Обычно адреса крупных фирм созвучны их названиям, например www.pepsi.com, www.gaz.ru, www.motorola.ru.

 

2. Краткий обзор поисковых указателей

Наиболее популярными поисковыми указателями сегодня являются:

«Рамблер» (https://www.rambler.ru)

«Яндекс» (https://www.yandex.ru)

«Апорт2000» (https://www.apport.ru)

«Google» (https://www.google.ru)

«Yahoo» (https://www.yahoo.ru)

«Mail» (https://www.mail.ru)

«AltaVista» (https://www.altavista.ru)

 

Четыре вида поиска

Все поисковые указатели реализуют несколько алгоритмов поиска.

Простой поиск. При простом поиске в поле запроса вводится одно или несколько слов, которые характеризуют содержание документа. Приемы простого поиска в разных поисковых системах свои.

Расширенный поиск — всегда подразумевает запрос из группы слов, которые связываются логическими операторами. Основное достоинство расширенного поиска в том, что правила записи ключевых слов и логических операторов в разных системах либо одинаковы, либо очень похожи.

Контекстный поиск — полезный вид поиска, который реализован не во всех поисковых указателях. При контекстном поиске требуется точное совпадение фразы или группы слов, и в большинстве поисковых систем, включающих этот метод, ключевая фраза заключается в кавычки.

Специальный поиск. С помощью команд этого вида поиска разыскивается дополнительная информация и вразных поисковых системах эти команды свои.

Приемы поиска в системе «Yandex»

Яндекс — поисковая машина, способная по Вашему запросу найти в русскоязычной части Интернета наиболее подходящие Web-страницы, новости, картинки, статьи энциклопедий или товары, дать ответ на вопрос о погоде или культурных событиях. Поиск по одному слову. В поле поиска вводится искомое слово и нажимается кнопка «Найти». Слова разыскиваются с учетом всех возможных словоформ. Если поиск словоформ не требуется, то его можно отменить поставив «!» перед словом.

Поиск по группе слов. Если слова разделены пробелом, то разыскиваются документы, в которых в одном предложении встречаются все введенные слова. Чтобы строго обеспечить появление слов в предложении надо перед ними поставить знак «+» слитно с тем словом, к которому он относится (+быть +или +не быть). Маленькая хитрость. Тот же результат можно достичь, задав «обязательные» слова в кавычках: "быть или не быть".

Поиск цитаты. Если вы хотите найти точную цитату, просто задайте искомую фразу в кавычках. По такому запросу будут найдены все страницы, в которых есть нужная вам цитата.

Поиск имени. Слова с большой и маленькой буквы считаются разными формами одного слова, поэтому все равно, какой регистр использовать в запросе. Исключением является оператор точной формы. По запросу «лужков» будут найдены все документы, содержащие эту словоформу в любом регистре, а по запросу «Лужков» - только документы, в которых имеется форма «Лужков» с большой буквы. Это полезно, если искомое имя собственное совпадает с распространенным словосочетанием, например, группа Черный кофе.

Приемы исключения слов из поиска. Чтобы исключить документы, в которых встречается определенное слово, поставьте перед этим словом: знак «—» без пробела, (строгое исключение из предложения); знак «~» (нестрогое исключение из предложения); знак «~~» (исключение из всего документа).Например, если вам нужно описание Парижа, а не предложения многочисленных турагентств, задайте запрос путеводитель по Парижу -агентство -тур.

Результаты поиска. На странице результатов поиска Яндекса есть тексты, поясняющие результаты поиска, и ссылки, дающие возможность сортировать найденное или уточнять запрос.

Искать в найденном. Если в результате запроса Яндекс нашел много документов, но по более широкой теме, чем вам хочется, вы можете сократить этот список, уточнив запрос. Еще один вариант — включить флажок в найденном в форме поиска, задать дополнительные ключевые слова, и следующий поиск будет вестись только по тем документам, которые были отобраны в предыдущем поиске. Например, чтобы найти страницы про кондиционеры — средства, предназначенные для ухода за волосами (а не климатическую технику), можно задать запрос кондиционеры, для определения области поиска. А затем, поставив галочку в найденном, — слово «волосы».

Параллельные поиски. Яндекс умеет искать не только сайты, но и новости, товары, картинки и т.д. Когда вы задаете запрос, поиск ведется одновременно по всем «параллельным» базам, и если что-либо найдено, Яндекс покажет информацию среди результатов поиска. В правой колонке — товары и картинки, внизу или вверху страницы — новости, словари, карты, афиша, погода. И все это — одним запросом! Вверху списка найденных документов выдается статистика слов запроса и найденных документов.

Похожие документы. Ссылка «Похожие документы» позволяет найти страницы, которые похожи на выбранную вами и могут отвечать на запрос столь же хорошо. Если страница-образец уже удалена с сайта, Яндекс выдаст сообщение: «Запрошенный(е) документ(ы) не найден(ы)». По умолчанию ссылка не показывается, включить ее отображением можно в настройках поиска. Вы также можете искать похожие документы в форме расширенного поиска.

Еще с сайта. Ссылка «Еще с сайта» позволяет увидеть все документы с выбранного сайта, соответствующие запросу. Вы также можете задать ограничения по сайту в форме расширенного поиска.

Сортировка результатов. Вы можете отсортировать найденные страницы одним из двух способов:

· по степени их соответствия запросу (релевантности);

· по дате последнего изменения документа.

По умолчанию сортировка идет по релевантности, а сортировка по дате нужна, как правило, только когда вы ищете максимально свежие документы.

Другие поисковые системы. Если ответ Яндекса на ваш запрос оказался недостаточно точным, попробуйте сформулировать запрос иначе, либо задайте его другим поисковым системам. Достаточно нажать на ссылку с именем поисковика, и в новом окне откроются его результаты поиска.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2020-11-01 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: