Правила создания поисковых образов




Естественный язык запросов привлекает своей простотой, однако, как показывает практика, он менее эффективен при серьезном поиске, когда ставится задача найти все или большинство документов на заданную тему.

На основе предварительно полученной информации о предмете поиска необходимо составить максимально широкий набор ключевых слов в виде отдельных терминов, словосочетаний, названий и фамилий, тесно связанных с проблемой.

1. В конце поискового образа знак препинания «.» не ставится.

2. При формировании поискового образа лучше использовать несколько ключевых слов, чем 1 ключевое слово (отмена крепостного права 1861 Александр II манифест).

3. Как правило, записанные в поисковом образе слова воспринимаются поисковой системой по логике & (И); однако возможно, что поисковая система воспримет их по логике ׀ (ИЛИ); для выяснения логики восприятия необходимо записать поисковый образ дважды и 2 раза выдать запрос: «ароматические растения» и «ароматические&растения».

Иными словами, если Вы вводите запрос к поисковой машине, состоящий из нескольких слов, то в результате получаете список документов, в которых встречается хотя бы одно слово.

4. При необходимости в поисковый образ можно вводить слова, которые не должны встречаться в искомых документах. Обычно для этого перед ключевым словом используется либо знак "-", либо слово NOT: ‘пищевые –лекарственные –ядовитые травы’ или ‘пищевые NOTлекарственные NOT ядовитые травы’.

5. Если слово обязательно должно присутствовать в документе, перед ним необходимо поставить знак «+» (автомобили +ГАЗ).

6. Начинайте имена собственные: названия компаний, городов, фамилии людей, и др. с заглавных букв, а все остальные слова пишите только маленькими буквами.

7. В общем случае регистр написания поисковых слов и операторов значения не имеет, то есть дом и ДОМ, Not и nOt воспринимаются одинаково. И лишь иногда, в целях повышения качества поиска, регистр слов поискового запроса принимается во внимание.

Например, если запрос состоит из двух, трех или четырех слов, каждое из которых написано с большой буквы, то предполагается поиск по имени собственному, и автоматически производится изменение ограничения расстояния между словами запроса со значения по умолчанию на величину (n-1)*2, где n - количество слов запроса. Это позволяет находить группу слов запроса, внутри которой есть не более одного "лишнего" слова или знака препинания, например "Баден-Баден", "А. Пушкин", "Федор Михайлович Достоевский".

8. Необходимо учитывать, что по каждому слову запроса поисковая система проводит поиск с учетом правил словоизменения языка по всем формам слова. Например, при поиске по слову 'человек' будут также найдены документы, содержащие слова 'человеку', 'человеком', 'человека' и даже 'люди'. Чтобы провести поиск только по одной определенной форме слова, нужно взять его в двойные кавычки или воспользоваться поиском точной фразы.

9. Знак «двойные кавычки» можно использовать для поиска слова в заданной форме (по умолчанию слова находятся во всех формах). Например, запросу 'самолет "заправился" посадка' удовлетворяет документ, содержащий текст '... самолет совершил посадку и заправился...', и не удовлетворяет документ, содержащий текст '.. самолет совершил посадку, чтобы заправиться...'.

10. Если вы хотите найти фразу целиком - заключите ее в кавычки («красная шапочка», «Воронежский региональный центр»);

11. Если вы вводите запрос к поисковой машине, состоящий из нескольких слов, то в результате получаете список документов, в которых встречается хотя бы одно слово.

12. Если Вы хотите, чтобы были найдены документы, в которых содержатся все слова запроса, их необходимо объединить оператором AND. Например, по запросу 'собака AND кошка' найдутся только те документы, которые содержат и слово 'собака', и слово 'кошка'. В то же время, по запросу ‘собака кошка’ будут найдены документы, содержащие только слово ‘собака’, только слово ‘кошка’ и оба эти слова.

Оператор AND имеет 2 формы записи: ‘AND’ и ‘&’.

13. Целесообразно длинные слова записывать с использованием подстановочного символа «*»; этот символ заменяет любое количество символов до конца слова.

14. По возможности необходимо избегать употребления в поисковом образе стоп – слов.

15. В сложных поисковых образах целесообразно применить группирование слов: (технология ׀ изготовление) (сыра ׀ творога).

16. Если запрос составлен из одного или нескольких слов без применения операторов и конструкций языка запросов, то будут найдены документы, в которых встречаются все слова запроса. При этом для каждого запроса всегда существует так называемое ограничение контекста - положительное число, по умолчанию равное расстоянию в 40 слов. Документ, в котором встретились все слова запроса, будет выдан только в том случае, если расстояние в словах между вхождениями слов запроса будет меньше этого числа. Например, по запросу 'экологически чистая' будут найдены те документы, в которых слова 'экологически' и 'чистая' хотя бы один раз встретятся менее чем в 40 словах друг от друга. Значение ограничения контекста можно изменять специальной конструкцией.

17. Указывайте расстояние между словами. ‘СЛ5(оптика линза)’. Такая запись означает, что в тексте между указанными словами могут находиться не более 5 слов.

18. Расстояние между словами может указываться другим способом: ‘слово1/ + m слово2’ («экологически/+1 чистая» или «экологически /+5 чистая).

19. Если список найденных Web – страниц мал, целесообразно использовать синонимы.

20. Если количество Web – страниц исчисляется сотнями, то необходимо уточнить поисковый образ, введя дополнительные ключевые слова, или воспользоваться специальными средствами расширенного поиска.

21. Чем больше ключевых слов входит в поисковый образ, тем короче и конкретнее будет список выданных Web – страниц.

22. Используйте комбинированный поиск фраз. Фразы позволяют выполнять поиск слова с учетом контекста. Машина ищет точное совпадение с текстовой строкой, заключенной в кавычки. Скомбинировав несколько фраз искомого документа с помощью оператора языка запроса AND, можно существенно увеличить точность запроса.

23. Применяйте редкие слова. Если вы хотите найти документ по одному или нескольким словам, выберите наиболее необычные. Тем самым вы избежите напрасной траты времени на перебор бесполезных для вас сайтов.

24. Не употребляйте очень распространенных терминов. Слова типа «компьютер», «провайдер», «Web», «Windows» приводят к высокой выборке нерелевантных узлов, то есть к большому количеству шумовой информации. Некоторыми машинами поиска подобные термины (стоп-слова) вообще не учитываются.

25. Избегайте игнорируемых ключевых слов. Игнорируемыми (стоп-словами) называют слова, которые разработчики механизмов поиска автоматически исключают из запроса. Так, если вы попробуете в запросе указать, например, слово «компьютер», то получите ответ «Документы, удовлетворяющие данному запросу, не найдены». Большинство машин поиска игнорируют также одно, двух- и трехбуквенные слова. Иногда не выполняется также поиск слов, начинающихся с цифры.

 


 

 

Наиболее мощные поисковые системы:

1. Http://www.yandex.ru - российская

2. Http://www.rambler.ru - российская

3. Http://www.mail.ru - российская

4. Http://www.aport.ru - российская

5. Http://www.google.ru – американская (русский интерфейс)

6. Http://www.yahoo.com – американская (английский интерфейс)

7. http:/www.altavista.com – американская (английский интерфейс)

 

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2021-01-31 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: