Координация понятий выражается в использовании различных операций над совокупностью понятий при индексировании документов или при поиске документов.
Выделяются два направления:
1. Использование только логических операций
2. Использование определенной грамматики понятий, классов, рубрик в рамках определенного семантического языка
Класс – совокупность (множество) документов, проиндексированных кодом соответствующего класса.
Логические операции над классами приведены в таблице.
Операция | Пояснение |
Объединение классов X и Y (логическая сумма, операция ИЛИ, дизъюнкция) | Называется множество документов Х ИЛИ Y, проиндексированных кодом класса Х или Y, либо одновременно кодами обоих классов (Х Y) |
Пересечение классов X и Y (логическое произведение, операция И, конъюкция) | Называется множество документов Х И Y, проиндексированных одновременно кодами классов Х и Y (X∩Y) |
Дополнение класса Х (логическое отрицание, операция НЕ) | Называется множество документов не проиндексированных кодом класса Х (Х’ = Х) |
Включение класса Х в Y | Называется такое множество Х, когда любой документ, проиндексированный кодом класса Х, одновременно проиндексирован кодом класса Y (Y→X) |
Предкоординация понятий предусматривает использование операций над классами при индексировании документов.
Предкоординация понятий предусматривает осуществление операций над классами при поиске документов, т.е. в процессе формирования поискового образа запроса.
Информационно – поисковые тезаурусы
Большую роль в развитие информационно – поисковых систем сыграла система унитермов, согласно которой содержание документа индексируется совокупностью терминов в виде однословных обозначений – унитермов, в качестве которых чаще всего выступают элементы словаря ключевых терминов по определенной предметной области.
Недостатки системы унитермов, приводящие к неоднозначности индексирования документов:
ü Ложная координация
ü Проблема синонимичности и омонимичности
Для преодоления этих недостатков в чисто дескрипторную систему унитермов ввели составные термины, указатели связи и ролей терминов, внося тем самым элементы семантики. Это привело к созданию информационно – поисковых тезаурусов.
Тезаурус:
1. Классификационная схема: определяется систематизацию дескрипторов по уровням иерархии, исходя из родо – видовых или ролевых отношений
2. Алфавитный перечень дескрипторов: содержит словарный фонд для индексировании документов
Контрольные вопросы:
1. Что называется поисковой системой?
ИПС – это информационная система с единым хранилищем единичных элементов данных и с развитым инструментарием их поиска и отбора.
2. Какие синонимы есть у термина «поисковая система»?
03.10.2012
1.
1.1. Что из себя представляет модель веб – пространства?
Впервые создана в 1999 году в Институте поиска и анализа текстов (США).
Модель опровергла представления об интернете как о едином густом пространстве.
Проследив с помощью поискового механизма 200 млн. web-страниц и несколько миллиардов ссылок ученые пришли к выводу о неоднородной структуре интернета и создали топологическую модель, близкую к модели Bow Tie (галстук-бабочка)
1.2. Что такое отправные веб – страницы?
Это Web-страницы, которые содержат гиперссылки, ведущие в конечном счете к ядру.
Ядро - Компоненты сильной связности (SCC).
Сюда относятся web-страницы, связанные так тесно, что, следуя по гиперссылкам, из любой из них в конечном счете можно попасть на любую другую.
1.3. Что такое конечные веб – страницы?
К этим web-страницам можно прийти по ссылкам из ядра.
2. Музей Виктора Астафьева в городе Чусовом
https://www.chusowoy – rayon.ru/kult – 4.html
Литературный музей Виктора Петровича Астафьева
Посольство Сенегала в России
https://ambassen.ru/contacts.html
Сенегал и Россия
Сайт Пушкинского дома
https://www.pushkinskijdom.ru/
Институт русской литературы (Пушкинский дом) Российской Академии наук
Сайт актрисы Натальи Бондарчук
https://nbondarchuk.ru/
Золотой век
Название сайта, адрес в интернете и его расположение в структуре выбранного каталога
3.
08.10.2012
Гипертекст – это система информационных объектов (документов или статей), объединенных между собой направленными связями, образующими сеть.
В узком смысле гипертекст представляет собой обычный текст, содержащий ссылки на другие связанные по смыслу