Поиск методом исключений




ТЕХНОЛОГИИ ПОИСКА ТЕМАТИЧЕСКОЙ ИНФОРМАЦИИ

В СЕТИ INTERNET

 

Представление о контекстном поиске

Контекстный поиск - поиск по текстам документов (комментариев). Производится при выборе условия поиска «Поиск по тексту».

При вводе поисковой фразы система дает предупреждение о «шумовых словах», используемых в запросе. Такие слова выделяются цветом, появляется предупреждающее сообщение, и при поиске они будут отброшены. Кроме этого при вводе запроса автоматически подключается словарь (тезаурус) словоформ, что, с одной стороны, позволяет упростить процесс составления (ввода) поисковой фразы (пользователь выбирает предлагаемые системой слова, заведомо содержащиеся в базе данных), а с другой стороны, система сразу выделит во введенной поисковой фразе слова, которых нет в текстах базы данных.

Существует несколько видов контекстного поиска (Рисунок 4)

 

 
 

 


Рисунок 4. Виды контекстного поиска

Алгоритм контекстного поиска

Алгоритм контекстного поиска следующий:

¾ в слове (словах поисковой цепочки) выделяется основа (в каждом слове отбрасываются окончания);

¾ порядок слов в поисковой фразе не важен, слова фразы объединяются по принципу логического “И”;

¾ система воспринимает группу слов, заключенных в кавычки, как задание найти тексты, в которых искомые слова находятся рядом (составляют фразу);

¾ в поисковой фразе не пропускаются “шумовые слова”. В поисковой фразе контекстного поиска возможно использование чисел и буквенно-цифровых последовательностей (номера документов, химические формулы и т.п.). Допустимыми символами для таких последователь­ностей являются буквы русского и латинского языка, дефис, наклонная и обратная черта (“\” и “/”).

Запросы и их виды

Как говорят, сколько людей, столько и мнений. Кому то интересна одна тематика, кому-то другая – один ищет одни ответы на свои вопросы, второй на другие. У каждого пользователя поисковой системы свои задачи, которые он хочет решить. Для этого он набирает свой запрос. Он может отличаться от запросов других людей по количеству слов, по смыслу, по популярности, с привязкой на определенную местность и т.д. Поэтому в поисковом продвижении всевозможные слова четко классифицированы.

Знание классификации поисковых запросов крайне важно для успешного создания семантического ядра. Поэтому рассмотрим виды запросов.

Длина

Бывают однословные, двусловные, трехсловные и многословные. Стоп-слова (местоимения, предлоги, союзы и междометия) не учитываются при подсчете. Чем больше слов в запросе, тем он точнее, соответственно проще пользователю поисковой системы найти необходимую информацию. Например: мебель, мягкая мебель, мебель для детской комнаты, интернет магазин мебели в Шадринске.

Четкость

Здесь все поисковые фразы делятся на четкие и нечеткие. Конкретный запрос подразумевает конкретный ответ. Если вопрос расплывчатый, поисковая система выдаст пространственный ответ на похожие темы запроса. Например, запросы “фильмы Октябрь” и “фильмы в кинотеатре Октябрь” отличаются только одним словом, но именно это слово в корне меняет смысл вопроса. Пользователь получит на них совершенно разную выдачу.

В первом случае появятся ссылки на все киноленты, которые показывались (или будут показываться) в октябре месяце или будут в своем названии содержать слово “октябрь”.

Во втором случае выйдет список на документы о кинолентах в кинотеатре Октябрь.

Частотность

Это число, которое показывает сколько раз эту поисковую фразу спрашивали пользователи поисковых систем в течение месяца. Соответственно, чем оно больше, тем популярней тема вопроса. Различают высоко- средне- и низкочастотные запросы. Для каждой тематики эти показатели очень разные и зависят от ее конкурентности и популярности. Например, для популярной тематики “вязание спицами” высокочастотные слова начинаются с 10000, а низкочастотные доходят до 2500.

Конкурентность

Этот параметр показывает популярность тематики и коренным образом влияет на сложность продвижения целевой страницы по этому запросу. Чем важней тема вопроса, тем больше средств необходимо вложить для продвижения целевой страницы в топ-10. Это обычно ключевые слова, которые относятся к товарам и услугам. Различаются на высоко- средне- и низкоконкурентные запросы. Но их градация не такая же, как в параметре частотности. Высококонкурентное слово может быть как высокочастотным, так и средне- и низкочастотным. Но далеко не всегда низкочастотное слово может быть высоко- и средне-конкурентным. Обычно, в 85% оно низкоконкурентное.

Зависимость от географии

Существуют геозависимые и геонезависимые поисковые фразы. Если запрос включает в себя точное местонахождение (обычно это город в Рунете) или сам запрос не требует указания местонахождения, то такой вопрос является геонезависимым. Если же запрос подразумевает уточнение пункта местности, то он является геозависимым. Например, ключевой запрос “заказ пиццы в Шадринске” геонезависимый, потому что он указывает местность. “Рецепт пиццы” тоже не зависит от точного пункта назначения, потому что пользователю поисковой системы не важно, в каком городе делается пицца – в каждом городе эти рецепты одни и те же. А вот запрос “заказ пиццы” является геозависимым, потому что подразумевает задание конкретного адреса.

Целевая составляющая

Это самый важный параметр, который показывает принадлежность запроса к определенному виду цели, которую хочет достичь пользователь поисковой системы. Бывают информационными, навигационными, транзакционными, мультимедийными, общими и служебными.

¾ навигационный запрос показывает пользователю информацию о конкретном месте в сети Интернет. Например, это может быть веб-ресурс какой-то компании или ссылка на известный сайт или географический документ. Например, “город Москва” или “официальный сайт компании Sony”;

¾ информационный запрос необходим тогда, когда пользователь желает найти конкретную информацию или сведения в Интернете. Почти всегда пользователь не знает, где именно искать, но зато точно понимает, что именно он хочет увидеть. Именно по таким запросам продвигаются различные информационные порталы и большинство блогов;

¾ транзакционный запрос подразумевает под собой определенное действие, которое хочет совершить пользователь поисковой системы. Такие поисковые запросы, как “заказать книгу” или “купить детскую кровать” показывают желание человека сделать транзакцию;

¾ мультимедийный запрос говорит о том, что пользователь поисковика ищет аудио, видео или графический файл в Интернете. Раньше такой запрос просто входил в группу транзакционных, но в последнее время с увеличением мультимедийного контента он стал входить в отдельную группу.

¾ общий запрос получается у пользователей, которые не выражают какую-либо конкретику, когда запрашивают у поиска необходимую информацию. Обычно такой запрос отражает общее понятие и часто состоит из одного или двух слов;

¾ служебный запрос часто используют специалисты и профессионалы определенных видов деятельности. Из-за своей специфичности их используют только для продвижения сайтов узконаправленной тематики.

Подразделение по стадии поиска

Есть еще важная градация запросов, которые используются для продвижения продающих страниц. Эти страницы содержат в себе контент конкретной услуги или товара. Для успешной реализации покупателя ведут по 4-м стадиям продаж: сначала посетителю рисуют проблему, потом находят решение этой задачи, выбирают вариант ее решения и в конце приводят к форме подписки, покупки и т.д., где он выполняет конечную транзакцию. Соответственно по всем этим стадиям пользователь поисковой системы задает конкретный запрос.

Сезонность

Очень важный момент, который необходим для правильного продвижения информационных сайтов многих тематик. Дело в том, что есть такие ключевые слова, которые актуальны только в определенное время года (дни, недели или месяцы).

Поиск методом исключений

Поисковая система реализует возможность задания сложных поисковых запросов, позволяющих находить сообщения по содержащимся в них словам или фразам, а также по значению определенных свойств, таких, как источник, сайт, домен, страна, язык, сюжет, категория, дата публикации или обнаружения. Выражение формируется из операторов, принадлежащих трем классам: базовые, логические и ограничивающие.

Базовые операторы возвращают списки сообщений по определенным ключам, таким, как слово, источник или сайт. Набор базовых операторов продиктован внутренней структурой хранения информации в системе.

Логические операторы позволяют комбинировать выражения, объединяя, пересекая результаты поиска, либо исключая один результат из другого.

Ограничивающие операторы сужают результат поиска, фильтруя найденные сообщения по указанным критериям.

Синтаксис поискового запроса:

Обычно запрос представляет из себя просто одно или несколько слов, например, контактная информация. По такому запросу будут найдены страницы, на которых встречаются оба слова запроса.

Логические операторы (Табл.7) позволяют строить более сложные запросы, например: контактная информация или телефон. По такому запросу будут найдены страницы, на которых встречаются либо слова "контактная" и "информация", либо слово "телефон".

По запросу контактная информация не телефон будут найдены страницы, на которых встречаются либо слова "контактная" и "информация", но не встречается слово "телефон".Вы можете использовать скобки для построения более сложных запросов.

Таблица 4. Логические операторы

Оператор Синонимы Описание
И and, &, + Оператор логическое "и" подразумевается, его можно опускать: запрос "контактная информация" полностью эквивалентен запросу "контактная и информация".
или or, | Оператор логическое "или" позволяет искать товары, содержащие хотя бы один из операндов.
Не not, ~ Оператор логическое "не" ограничивает поиск страниц, не содержащих слово, указанное после оператора.
()   Круглые скобки задают порядок действия логических операторов.


Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2019-03-02 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: