Порядок выполнения работы




Московский инженерно-физический институт

(Государственный университет)

 

 

Кафедра Системного анализа

 

 

Методические указания по

выполнению самостоятельных работ

по дисциплине

Автоматизированные информационные системы и технологии

(Раздел 1)

(для группы В5-09)

 

Москва 2012г.

 


Введение

 

Целью лабораторного практикума является практическое изучение средств и технологий поиска на примере реферативно-библиографических БД и информационных ресурсах Internet.

Цикл включает три работы:

- сравнительное изучение технологий информационного поиска в документальных реферативно-библиографических БД;

- сравнительное изучение информативности информационных Internet-ресурсов.

 

Основным информационным ресурсом является промышленная база данных «Информатика», содержащая вторичную информацию (библиографию, рефераты и ключевые слова) по отечественным и зарубежным публикациям с 1987 по 2000гг. в области информатики и полиграфии (ок. 90000 док-тов), и предоставляемая на CDROM в среде АИПС IRBIS под управлением ОС MS Windows.

Руководство по применению АИПС WinIRBIS (версия для MS Windows) см. файл WINIRBIS.DOC

 


Лабораторная работа 1

 

Изучение средств подготовки поискового предписания и

Стратегий поиска документальной информации в реферативной БД

 

Цель работы: Освоение средств подготовки поискового предписания и оценка стратегий поиска информации в базе данных реферативно-библиографической информации.

Метод выполнения. В работе используются три следующих поисковых технологии:

1). “Вербальная” технология - поиск по поисковому предписанию (ПП) в режиме “запрос-ответ", в том числе:

q поиск по структурированному ПП с использованием только нормализованной лексики поля ключевых слов;

q поиск по ПП, построенному с использованием операторов полного ИПЯ со свободной лексикой по полю ключевых слов;

q поиск по комбинированному ПП, с несколькими поисковыми полями в т.ч. с использованием общего поискового словаря;

q поиск по ПП с использованием критерия частичного вхождения.

 

2). Технология накопления результата.

 

3). Технология реформулировки запроса по обратной связи.

 

Оценка качества поиска проводится с помощью показателей эффективности работы АИПС.

Для этого каждый полученный документ должен быть оценен на соответствие теме (информационной потребности) по следующей шкале:

- "релевантен", если соответствует теме и удовлетворяет информационной потребности;

- "неопределенная релевантность", если соответствует теме но не удовлетворяет информационной потребности;

- "нерелевантен", если не соответствует теме.

 

Для последующего избирательного обращения к подмножествам (например, релевантных) документов - результатов поиска по одному или нескольким предложениям (например, для последующей динамической реформулировки запроса) можно использовать функцию "Результат", разделяющую документы на подмножества по релевантности (при работе с протоколом поиска).

 

Работа выполняется в среде АИС ИРБИС на материале БД ИНФОРМАТИКА и включает в себя три этапа:

1. Структурирование запроса и формирование исходного поискового предписания;

2. Изучение технологии формирования ПП и выполнения поиска по запросу;

3. Поиск в режиме динамического реформулирования запроса.

 


 

Порядок выполнения работы

 

Этап 1. Структурирование запроса и формирование исходного ПП

1. Сформулировать в соответствии с рубрикатором ВИНИТИ “Информатика” тему, определить смежные темы и аспекты (подтемы).

2. Выделить основные понятия, определяющие предметную область темы, определить смежные понятия, связанные ассоциативными или родо-видовыми отношениями. Построить граф понятий, указав вид отношений.

Редуцировать отношения между понятиями до уровня условия "совместного присутствия" (это создает основу для перехода использованию в ПП логические операторы "И", "ИЛИ", "НЕ").

3. Для каждого понятия составить список терминов из словаря поля ключевых слов, обозначающих понятие, или однозначно характеризующих документ, содержащий это понятие как основное.

Смысловое соответствие термина теме оценивается суб"ективно на основании анализа текстов документов, его содержащих.

 

Для получения текстов документов, содержащих термин, можно использовать:

- функцию просмотра документов из словаря;

- поиск “аналогов” - документов, поисковый образ которых содержит часть терминов текущего документа, указанных выделением (функция “Поиск”) или порогом мощности подмножества терминов поля (функция “Аналог”).

 

Технология “накопления результата” используется при просмотре документов (во время последовательного просмотра базы или при обращении к документам, содержащим выбранный в словаре термин) и позволяет, используя функцию "В папку", включить ссылку на этот документ непосредственно в результат (хотя и без поиска по явно задаваемому ПП). Папка фиксируется в протоколе отдельным предложением функцией “Показать папку”.

 

4. На основе полученного списка терминов для поиска по полю "Ключевые слова" составить поисковое предписание в виде логического выражения, в котором отдельные понятия связаны условием обязательного вхождения (оператором И). При этом каждое понятие может обозначаться об"единением терминов (слова - синонимы, связанные оператором ИЛИ).

 

5. Провести поиск по полю "Ключевые слова". Оценить результаты поиска по количеству релевантных и нерелевантных документов в выдаче.

Изменением состава терминов добиться, чтобы выдача содержала 30-60 документов, в том числе не менее 15-20% релевантных.

Разделить выдачу на подмножества по релевантности (функцией "Результат").

 

6. Для терминов, анализируемых при подготовке запроса, заполнить таблицу частотных характеристик (частота в выдаче / частота в БД). Для терминов, не включенных в ПП, указать частоту в выдаче равной 0.

 

7. Подготовить отчет, включающий:

- содержательное и структурное представление темы поиска;

- таблицу частотных характеристик;

- содержательный анализ эффективности терминов ПП с точки зрения отражения темы;

- протокол работы с БД.

 

Этап 2. Изучение “вербальной” технологии поиска по запросу

8. Используя уточняющие термины и операторы ИПЯ, (в том числе маскирование), модифицировать поисковое предписание, полученное в п.5, так, чтобы выдача содержала не менее 40-60% релевантных документов.

В таблицу частотных характеристик включить вновь добавленые термины.

Оценить выдачу. Разделить выдачу на подмножества по релевантности.

 

9. Использовать полученное в п.8 терминологическое выражение для поиска по полю "Реферат".

Оценить результат. Разделить выдачу на подмножества по релевантности.

 

10. Используя термины словаря по полю реферата и операторы ИПЯ модифицировать полученное в п.9 поисковое предписание так, чтобы выдача содержала не менее 40-60% релевантных документов, но не меньше чем в п.8.

Оценить результат. Разделить выдачу на подмножества по релевантности.

 

11. Получить об"единение результатов поиска по п.8 и п.10.

 

12. Построить об"единенное выражение для поиска по обобщенному словарю текстов базы данных, содержащему слова полей заголовков, рефератов и ключевых слов.

Провести поиск. Оценить выдачу.

Модифицировать ПП так, чтобы выдача содержала 30-50% релевантных документов, но не меньше чем в п.10.

Оценить и разделить выдачу на подмножества по релевантности.

 

13. Используя поисковое предложение п.8 и п.10, выполнить поиски с “автомаскированием”.

Оценить результаты и разделить выдачи на подмножества по релевантности.

 

14. Используя поисковое предложение п.8 и п.10, выполнить поиски по критерию “частичного вхождения” с “автомаскированием”.

Оценить результаты и разделить выдачи на подмножества по релевантности.

 

15. Для терминов, использованных в предложениях запроса п.8 и п.10, заполнить таблицы частотных характеристик.

 

16. Подготовить отчет, включающий:

- таблицу частотных характеристик;

- протокол работы с БД.

Этап 3. Изучение технологии реформулирования запроса

“по обратной связи”

Поиск на контекстном поле (Внимание! пп. 17-21 выполняются только при работе в DOS-версии АИС IRBIS)

17. Выделить в протоколе предложение – релевантные документы, полученные при поиске по ключевым словам (п.8).

 

18. Сформировать словник для поиска по контекстному полю, отметить слова, наиболее точно соответствующие запросу.

 

19. Провести поиск на контексном поле.

 

20. Оценить выдачи по релевантности.

 

21. Сформировать общий результат контекстного поиска, выделив в протоколе соответствующие предложения.

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-04-27 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: