Итеративный эвристический поиск




РГГУ

 

 

Кафедра Моделирования в экономике и управлении

 

 

Методические указания по

выполнению самостоятельных работ

по дисциплине

Информационные технологии

В науке и образовании

 

Москва 2014г.

 


Введение

 

Целью лабораторного практикума является практическое изучение средств и технологий поиска на примере реферативно-библиографических БД и информационных ресурсах Internet.

Методической задачей работы является сравнительное изучение технологий информационного поиска, а также тематического, видового состава различных документальных и реферативно-библиографических ресурсов;

Основными информационными ресурсами являются реферативные базы данных, содержащие вторичную информацию (библиографию, рефераты и ключевые слова) по отечественным и зарубежным публикациям в области естественных наук (БД «Рефераты ВИНИТИ» на портале библиотеки МИФИ) или по общественным наукам (на портале ИНИОН РАН) предоставляемая в среде АИПС IRBIS, с порядком использования которой можно ознакомиться по контекстным справочным материалам (гипертекстовая ссылка – знак вопроса «?»). На втором этапе используются реферативные базы данных научных диссертаций (ИК диссертаций) и отчетов (ИК НИОКР), которые расположены на портале библиотеки МИФИ, электронные каталоги библиотек РГБ, ГПНТБ, БД патентной информации (патенты) на сайте ФИПС, а также две поисковые машины Internet.

 


 

Сравнительное изучение информативности

Информационных ресурсов

 

Цель работы: Освоение средств и технологий поиска информации в разнородных распределенных информационных ресурсах.

Основной задачей является сравнительная оценка информативности отдельных информационных ресурсов и эффективности поисковых средств. Косвенной задачей является освоение методов составления аналитических обзоров реферативного типа.

Метод выполнения. В работе используются три следующих поисковых технологии:

1). “Вербальная” технология - поиск по поисковому предписанию (ПП) в режиме “запрос-ответ", в том числе:

q поиск по структурированному ПП с использованием только нормализованной лексики поля ключевых слов;

q поиск по ПП, построенному с использованием операторов полного ИПЯ со свободной лексикой по полю ключевых слов;

q поиск по комбинированному ПП, с несколькими поисковыми полями в т.ч. с использованием общего поискового словаря;

q поиск по ПП с использованием критерия частичного вхождения.

2). Технология накопления результата.

3). Технология реформулировки запроса по обратной связи.

 

Для этого каждый полученный документ должен быть оценен на соответствие теме (информационной потребности) по следующей шкале:

- "релевантен", если соответствует теме и удовлетворяет информационной потребности;

- "нерелевантен", если не соответствует теме.

 

Порядок выполнения

Этап 1.

1. Сформулировать тему поиска, определить смежные темы и аспекты (подтемы).

2. Выделить основные понятия, определяющие предметную область темы, определить смежные понятия, связанные ассоциативными или родо-видовыми отношениями. Построить граф понятий, указав признак деления вышестоящего на нижестоящие понятия.

Редуцировать отношения между понятиями до уровня условия "совместного присутствия" (это создает основу для перехода использованию в ПП логические операторы "И", "ИЛИ", "НЕ").

3. Для каждого понятия составить список терминов из словаря поля ключевых слов, обозначающих понятие, или однозначно характеризующих документ, содержащий это понятие как основное.

Смысловое соответствие термина теме оценивается суб"ективно на основании анализа текстов документов, его содержащих.

4. На основе полученного списка терминов для поиска по полю "Ключевые слова" составить поисковое предписание в виде логического выражения, в котором отдельные понятия связаны условием обязательного вхождения (оператором И). При этом каждое понятие может обозначаться об"единением терминов (слова - синонимы, связанные оператором ИЛИ).

5. Провести поиск по полю "Ключевые слова". Оценить результаты поиска по количеству релевантных и нерелевантных документов в выдаче.

Изменением состава терминов добиться, чтобы выдача содержала не менее 10 документов, в том числе не менее 15-40% релевантных.

 

пп. 6-7 ОТСУТСТВУЮТ

 

8. Используя уточняющие термины и операторы ИПЯ, (в том числе маскирование), модифицировать поисковое предписание, полученное в п.5, так, чтобы выдача содержала не менее 40-60% релевантных документов.

Оценить результат.

В таблицу частотных характеристик включить вновь добавленные термины.

9. Использовать полученное в п.8 терминологическое выражение для поиска по полю "Реферат".

Оценить результат.

10. Используя термины словаря по полю реферата и операторы ИПЯ модифицировать полученное в п.9 поисковое предписание так, чтобы выдача содержала не менее 40-60% релевантных документов, но не меньше чем в п.8.

Оценить результат.

12. Построить об"единенное выражение для поиска по обобщенному словарю текстов базы данных, содержащему слова полей заголовков, рефератов и ключевых слов.

Провести поиск. Оценить выдачу.

Модифицировать ПП так, чтобы выдача содержала 30-50% релевантных документов, но не меньше чем в п.10.

Оценить выдачу.

13. Используя поисковое предложение п.8 и п.10, выполнить поиски с “автомаскированием”.

Оценить результаты.

14. Используя поисковое предложение п.8 и п.10, выполнить поиски по критерию “частичного вхождения” с “автомаскированием”.

Оценить результаты.

15. Подготовить отчет, включающий:

- таблицу частотных характеристик;

- протокол работы с БД.

Изучение технологии реформулирования запроса “по обратной связи”

Поиск на контекстном поле

17. Выделить в протоколе предложение – релевантные документы, полученные при поиске по ключевым словам (п.8), выполнить эвристический поиск.

18. Сформировать словник для поиска по контекстному полю (функция – гипертекстовая ссылка «Лексика релевантных документов» в заглавии формы – результате эвристического поиска), отметить слова, наиболее точно соответствующие запросу.

19. Провести поиск на контексном поле.

20. Оценить выдачи по релевантности.

 

Итеративный эвристический поиск

22. Выделить в протоколе предложение – релевантные документы, полученные при поиске по ключевым словам (п.8).

23. Для полученного результата выполнить эвристический поиск.

Оценить результат.

24. Для полученного результата выполнить эвристический поиск.

Оценить результат.

25. Для полученного результата выполнить эвристический поиск.

Оценить результат.

26. Сформировать итоговый результат.

Этап 2.

Поиск проводится по теме, выбранной на предыдущем этапе, и является ее продолжением в части привлечения информационных ресурсов, в том числе нахождения, как отдельных документов, так и тематических сайтов, отражающих работу научных коллективов и организаций.

В работе используются следующие поисковые средства и технологии:

- навигаторы, браузеры и поисковые машины (ПМ) Internet;

- вербальные технологии поиска;

- технологии поиска «по цитированию» и гипертекстовые технологии.

Основными информационными ресурсами являются реферативные базы данных научных диссертаций (ИК диссертаций) или отчетов (ИК НИОКР), которые расположенына портале библиотеки МИФИ (library.mephi.ru:45123/scripts/rweb.exe), электронные каталоги библиотек РГБ и ГПНТБ, БД патентной информации (патенты) на сайте ФИПС (www.fips.ru), БД издательств или информационных провайдеров а также две поисковые машины Internet (из: Yandex, Google, NIgma, AltaVista).

Внимание! Тексты найденных релевантных документов (дублируя сведения, если документ найден в нескольких ресурсах) сохранять для последующего использования при составлении аналитического обзора



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-04-27 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: