Координация понятий в классификационных системах




Координация понятий выражается в использовании различных операций над совокупностью понятий при индексировании документов или при поиске документов.

Выделяются два направления:

1. Использование только логических операций

2. Использование определенной грамматики понятий, классов, рубрик в рамках определенного семантического языка

Класс – совокупность (множество) документов, проиндексированных кодом соответствующего класса.

Логические операции над классами приведены в таблице.

Операция Пояснение
Объединение классов X и Y (логическая сумма, операция ИЛИ, дизъюнкция) Называется множество документов Х ИЛИ Y, проиндексированных кодом класса Х или Y, либо одновременно кодами обоих классов (Х Y)
Пересечение классов X и Y (логическое произведение, операция И, конъюкция) Называется множество документов Х И Y, проиндексированных одновременно кодами классов Х и Y (X∩Y)
Дополнение класса Х (логическое отрицание, операция НЕ) Называется множество документов не проиндексированных кодом класса Х (Х’ = Х)
Включение класса Х в Y Называется такое множество Х, когда любой документ, проиндексированный кодом класса Х, одновременно проиндексирован кодом класса Y (Y→X)

 

Предкоординация понятий предусматривает использование операций над классами при индексировании документов.

Предкоординация понятий предусматривает осуществление операций над классами при поиске документов, т.е. в процессе формирования поискового образа запроса.

Информационно – поисковые тезаурусы

Большую роль в развитие информационно – поисковых систем сыграла система унитермов, согласно которой содержание документа индексируется совокупностью терминов в виде однословных обозначений – унитермов, в качестве которых чаще всего выступают элементы словаря ключевых терминов по определенной предметной области.

Недостатки системы унитермов, приводящие к неоднозначности индексирования документов:

ü Ложная координация

ü Проблема синонимичности и омонимичности

Для преодоления этих недостатков в чисто дескрипторную систему унитермов ввели составные термины, указатели связи и ролей терминов, внося тем самым элементы семантики. Это привело к созданию информационно – поисковых тезаурусов.

Тезаурус:

1. Классификационная схема: определяется систематизацию дескрипторов по уровням иерархии, исходя из родо – видовых или ролевых отношений

2. Алфавитный перечень дескрипторов: содержит словарный фонд для индексировании документов

Контрольные вопросы:

1. Что называется поисковой системой?

ИПС – это информационная система с единым хранилищем единичных элементов данных и с развитым инструментарием их поиска и отбора.

2. Какие синонимы есть у термина «поисковая система»?

 

03.10.2012

1.

1.1. Что из себя представляет модель веб – пространства?

Впервые создана в 1999 году в Институте поиска и анализа текстов (США).

Модель опровергла представления об интернете как о едином густом пространстве.

Проследив с помощью поискового механизма 200 млн. web-страниц и несколько миллиардов ссылок ученые пришли к выводу о неоднородной структуре интернета и создали топологическую модель, близкую к модели Bow Tie (галстук-бабочка)

1.2. Что такое отправные веб – страницы?

Это Web-страницы, которые содержат гиперссылки, ведущие в конечном счете к ядру.

Ядро - Компоненты сильной связности (SCC).

Сюда относятся web-страницы, связанные так тесно, что, следуя по гиперссылкам, из любой из них в конечном счете можно попасть на любую другую.

1.3. Что такое конечные веб – страницы?

К этим web-страницам можно прийти по ссылкам из ядра.

2. Музей Виктора Астафьева в городе Чусовом

https://www.chusowoy – rayon.ru/kult – 4.html

Литературный музей Виктора Петровича Астафьева

 

Посольство Сенегала в России

https://ambassen.ru/contacts.html

Сенегал и Россия

 

Сайт Пушкинского дома

https://www.pushkinskijdom.ru/

Институт русской литературы (Пушкинский дом) Российской Академии наук

 

Сайт актрисы Натальи Бондарчук

https://nbondarchuk.ru/

Золотой век

 

Название сайта, адрес в интернете и его расположение в структуре выбранного каталога

3.

 

 

08.10.2012

Гипертекст – это система информационных объектов (документов или статей), объединенных между собой направленными связями, образующими сеть.

В узком смысле гипертекст представляет собой обычный текст, содержащий ссылки на другие связанные по смыслу



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2020-11-02 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: