Онтологический подход и его использование
Понятие онтологии
Онтологии имеют непосредственное отношение к построению БЗ и частично к реализации интеллектуального интерфейса. Они помогают обеспечить одинаковое понимание всеми пользователями смысла применяемых при решении терминов, их атрибутов и отношений между ними.
Термин «онтология» в ИИ употребляется в контексте с такими понятиями, как концептуализация, знания, модели знаний, системы, основанные на знаниях.
Онтология — это формально представленные на базе концептуализации знания о ПрО.
Под концептуализацией понимается процесс перехода от представления ПрО на ОЕЯ (или ЕЯ) к точной спецификации этого описания на некотором формальном языке, ориентированном на компьютерное представление.
Самым распространенным на данный момент является определение, согласно которому онтология есть точная (выраженная формальными средствами) спецификация концептуализации.
Онтология является не абсолютной (единственной) спецификацией концептуализации ПрО, а зависит от целей ее создания. Независимо от вида онтологии она должна включать словарь терминов и некоторые спецификации их значений. При таком подходе онтология похожа на тезаурус.
В неформальной трактовке онтология представляет собой описание некоторой ПрО.
На формальном уровне онтология — это система, состоящая из набора понятий и набора утверждений об этих понятиях, на основе которых можно строить классы, объекты, отношения, функции и теории.
На метауровне онтология является разновидностью сетевой модели знаний о ПрО. Эта модель может быть статической или динамической.
Web-онтологией называют онтологию, которая либо доступна на одном из web-узлов Internet, либо используется в рамках корпоративного портала.
Основные задачи, решаемые с помощью онтологий
1. Создание и использование БЗ.
2. Организация эффективного поиска в БД, информационных каталогах, БЗ.
3. Создание систем, реализующих механизмы рассуждений (ЭС, системы управления, интеллектуальные роботы).
Организация поиска по смыслу в текстовой информации.
Семантический поиск в Internet.
Представление смысла в метаданных об ИР.
Построение и использование баз общих знаний для различных ИС.
Обеспечение общей терминологии для множества специалистов и совместно используемых приложений.
Многократное применение БЗ и информационных массивов, представляющих сведения о системах на различных стадиях их жизненного цикла.
Методики построения онтологии и требования к средствам их спецификации
Существует много предложений по методикам разработки онтологии.
Стандарт онтологического исследованияIDEF5 подготовленный фирмой Knowledge Base Systems, Inc. в качестве проекта национального стандарта США (1994).
Процесс построения онтологии в рамках IDEF5 состоит из пяти основных этапов:
1. Изучение и систематизация начальных условий. Этот этап устанавливает основные цели и контекст разработки онтологии, а также распределяет роли членов проекта.
2. Сбор и накопление данных для построения онтологии.
3. Анализ и группировка собранных данных для облегчения согласования терминологии.
4. Начальное развитие онтологии. На этом этапе формируется предварительная онтология на основе систематизированных данных.
5. Уточнение и утверждение онтологии.
Для поддержки процесса построения онтологии в IDEF5 определены специальные онтологические языки:
· схематический язык (Schematic Language — SL);
· язык доработок и уточнений (Elaboration Language — EL).
Язык SL является наглядным графическим языком диаграммного типа, предназначенным для формирования начального представления онтологии, а также дополнения существующих онтологий.
Язык EL – структурированный текстовый язык, позволяющий детализировать элементы онтологии (структурировать элементы концептуализации).
В стандарте IDEF5 предусмотрены четыре вида схем, предназначенных для представления онтологической информации в наглядной графической форме:
Диаграммы классификации служат средством логической систематизации знаний, накопленных при изучении системы.
Существует два типа таких диаграмм:
· диаграмма строгой классификации (Description Subsumption — DS)
· диаграмма естественной или видовой классификации (Natural Kind Classification — NKC).
В DS определяющие свойства класса являются необходимым и достаточным признаком принадлежности объекта этому классу. С помощью диаграмм DS, как правило, классифицируются логические объекты.
В NKC, наоборот, свойства класса не являются необходимым и достаточным признаком принадлежности ему тех или иных объектов. В диаграммах этого типа интерпретация свойств класса является более общей.
Композиционные схемы (Composition Schematics) служат для графического представления состава классов онтологии. В частности, с помощью них можно наглядно отобразить состав объектов, относящихся к тому или иному классу.
Схемы взаимосвязей (Relation Schematics) позволяют визуализировать и изучать связи между различными классами объектов системы, а также представлять зависимости между взаимосвязями классов.
Диаграмма состояния объекта (Object State Schematic) позволяет описать процесс изменения состояния объекта (смена состояния или смена класса).
Стандарт IDEF5 отражает методологию, с помощью которой можно наглядно и эффективно разрабатывать онтологии, но данный стандарт охватывает не все этапы создания онтологии.
Существует еще одна методология построения онтологии. Для ее поддержки предназначена специальная инструментальная среда проектирования онтологии (Ontology Design Environment – ODE).
Она включает подсистемы управления проектом и поддержки разработки. Первая подсистема обеспечивает решение задач планирования, контроля за ходом выполнения проекта и управления качеством. Вторая ориентирована на задачи приобретения знаний, их оценки, интеграции, документирования и управления конфигурациями.
Процесс разработки онтологии включает четыре стадии:
1) спецификация;
2) концептуализация;
3) формализация;
Реализация.
Наиболее сложной задачей является концептуализация. От успешности ее выполнения зависит эффективность всей разработки.
Концептуализация включает два этапа:
· построение глоссария терминов;
· построение классификационных деревьев концептов.
Вторая задача начинает решаться тогда, когда объем глоссария по мнению экспертов достигает существенного объема. Затем для каждого классификационного дерева формируются словарь концептов и совокупность таблиц, описывающих бинарные отношения между концептами, экземпляры, атрибуты экземпляров и классов, логические аксиомы, константы и формулы.
В качестве примера программного решения для создания ИС на основе онтологического подхода можно привести мощную среду разработки OntoStudio фирмы Ontoprise GmbH (https://www.ontoprise.de), которая поддерживает следующие форматы и языки онтологического проектирования: OWL, RDF (S), RIF, ObjectLogic.