Появление новых вычислительных машин и программных продуктов приводит к необходимости пересмотра традиционных представлений об организации СУБД.
1. Во второй половине 80-х гг. ХХ века под влиянием роста интереса к объектно-ориентированному подходу в программировании начали активно разрабатываться объектно-ориентированные модели данных, а также основанные на них СУБД.
2. Рассматриваются новые подходы к архитектуре СУБД и, прежде всего, организация среды хранения баз данных. Принципиально новые подходы в этом направлении связаны с попытками аппаратной реализации функции СУБД. Предназначенные для этих целей аппаратно-программные комплексы получили название машин базы данных, позволяющих преодолеть ограничение производительности СУБД, которые вызваны сложностью их архитектур и выполняемыми ими функциями управления данными. Эти машины повышают уровень надежности систем базы данных.
3. Дальнейшее развитие инструментария базы данных в значительной мере стимулировано требованиями новых сфер их применении: системы регистрации и обработки данных физических экспериментов, приложения в космических исследованиях, геологии, географии, музейном деле и транспортных системах. Это требует поддержки обработки данных нетрадиционной природы, а именно: картинно-графических, пространственных, временных. В таких приложениях необходимы специфические структуры данных, матрицы, векторы, временные ряды, а также естественные для них операционные возможности.
4. По-прежнему актуально направление автоматизации проектирования базы данных. Главная задача – создание дружественного интеллектуализированного инструментария коммерческого характера для проектирования крупных баз данных.
|
5. Для дальнейшего развития технологий баз данных важное значение имеет деятельность по стандартизации в этой области. Этой деятельностью занимается международная организация по стандартизации (ISO). Одним из представляющих интерес ее результатов является создание международных стандартов языка баз данных реляционного типа – SQL.
6. В последние годы заметно активизировались исследования в направлении разработки систем программирования баз данных и знаний. Цель этих работ, история которых берет начало в 70-е гг., замыкается в создании предназначенных для программиста развитых комфортных языковых средств, позволяющих разрабатывать прикладные системы на основе базы данных. Языки программирования базы данных открывают возможности новых подходов к конструированию систем баз данных и к технологии их использования.
7. Интеллектуализацию систем управления базами данных. Начало этому направлению положено в 70-х годах, когда началось сближение с разработками в области экспертных систем и систем баз знаний. Стали предприниматься попытки использования в базе данных средств представления знаний, созданных в области искусственного интеллекта.
8. Общий успех СУБД в сочетании с исследованиями искусственного интеллекта привели к превращению СУБД в системы управлениями базами знаний.
54.Понятие баз знаний.
Совершенствование средств вычислительной техники позволяет значительно расширить сферу их применения в народном хозяйстве. В настоящее время при помощи ЭВМ решаются различные типы задач.
|
- Вычислительные задачи, в которых в соответствии с определенным алгоритмом и множеством входных данных получают множество результатов. Алгоритм в таких задачах выступает в качестве строгой последовательности операций.
- Информационные задачи – это нахождение части базы данных, соответствующей внешнему запросу. Алгоритм здесь – это последовательность информационно-поисковых процедур, а база данных – набор декларативных знаний.
- Задачи принятия решений, когда на основании определенного набора критериев из множества альтернатив выбирается наиболее подходящая для достижения поставленных целей. Цели и критерии могут быть как постоянными, так и изменяться в процессе решения задачи.
- Логические задачи, в которых по описанию начальной и целевой ситуаций из имеющегося набора действий синтезируется алгоритм достижения цели.
Для решения двух последних типов задач могут применяться методы искусственного интеллекта, основанные на знаниях. Одной из разновидностей систем, использующих эти методы, являются экспертные системы (ЭС). Они представляют собой попытку создания человеко-машинных комплексов для решения слабо формализуемых задач или задач, не имеющих алгоритмического решения.
При изучении интеллектуальных систем традиционно возникает вопрос: что же такое знания и чем они отличаются от данных, обрабатываемых на компьютере.
Данные представляют собой отдельные факты, характеризующие объекты, процессы и явления, а также их свойства. При обработке на ЭВМ данные трансформируются, условно проходя следующие этапы:
|
- данные как результат измерений и наблюдений;
- данные на материальных носителях информации (таблицы, протоколы, справочники);
- модели (структуры) данных в виде диаграмм, графиков, функций;
- данные в компьютере на языке описания данных;
- базы данных на машинных носителях информации.
Знания основаны на данных, полученных эмпирическим путем. Они представляют собой результат мыслительной деятельности человека, направленной на обобщение его опыта, полученного в результате практической деятельности.
Совокупность знаний нужных для принятия решений, принято называть предметной областью, или знаниями о предметной области. В любой предметной области есть свои понятия и связи между ними, своя терминология, свои законы, связывающие между собой объекты данных предметной области, свои процессы и события. Кроме того, каждая предметная область имеет свои методы решения задач.
Таким образом, знания – это закономерности предметной области: принципы, связи, законы, – полученные в результате практической деятельности, профессионального опыта, позволяющие специалистам ставить и решать задачи в этой области. При обработке на ЭВМ знания трансформируются аналогично данным:
- знания в памяти человека как результат мышления;
- материальные носители знаний (учебники, методические пособия);
- поле знаний – условное описание основных объектов предметной области, их атрибутов и закономерностей, их связывающих;
- знания, описанные на языках представления знаний (продукционные языки, семантические сети, фреймы);
- база знаний на машинных носителях информации.
Рассмотрим особенности знаний, которые отличают их от данных.
1. Интерпретация. Данные, хранимые в памяти ЭВМ, могут интерпретироваться только соответствующей программой. Данные без программы не несут никакой информации, в то время как знания имеют интерпретацию, поскольку они содержат одновременно и данные, и описание данных.
2. Наличие классифицирующих связей. Ни одна из разнообразных форм представления данных в отличии от знаний не обеспечивает эффективного описания связей между различными типами данных.
3. Наличие ситуативных связей. Совместимость отдельных событий или факторов в некоторой ситуации определяется ситуативными связями, а также такими отношениями, как одновременность, расположение в одной области пространства и т.д. Ситуативные связи позволяют строить процедуры анализа знаний на совместимость, противоречивость и другие, которые трудно реализовать при хранении традиционных наборов данных.
Знание обладает важным свойством – ценностью. Ценность знания в различные периоды различна в зависимости от того, какие задачи выдвигаются на передний план в определенный отрезок времени. При этом выделяют два вида ценности знания: непосредственную и потенциальную
Классификация знаний.
Имеется несколько подходов к классификации знаний. Так, по глубине выделяют знания поверхностные и глубинные. Поверхностные – это знания о видимых взаимосвязях между отдельными событиями и фактами предметной области. Глубинные – абстракции, аналогии, схемы, отображающие структуру и природу процессов, протекающих в предметной области. Эти знания объясняют явления и могут использоваться для прогнозирования поведения объектов. Современные системы работают в основном с поверхностными знаниями. Это связано с тем, что не всегда имеются универсальные методики, позволяющие выявлять глубинные структуры знаний и работать с ними.
По выполняемым функциям различают знания декларативные и процедурные (процедуральные). Декларативные знания не содержат в явной форме процедур, которые нужно выполнить. Такие знания представляются множеством утверждений, не зависящих от того, где они применяются. Их использование предполагает полное описание пространства состояний моделируемого объекта, которое носит синтаксический характер. Вывод и поиск решений базируются на процедурах поиска в пространстве состояний. Эти процедуры учитывают специфику конкретной предметной области, т.е. ее семантику. Следовательно, при декларативной форме представления семантические и синтаксические знания в определенной мере отделены друг от друга, что придает названной форме большую универсальность и общность.
Процедурные знания содержат описание некоторых процедур. Состояние объекта представляется в виде набора процедур, с помощью которых обрабатывается определенный участок базы знаний. Процедурные знания обеспечивают более быстрый поиск решения по сравнению с декларативными знаниями, однако уступают им в возможности накопления и актуализации знаний.
Существуют и более детализированный подход к классификации знаний. Так, различают:
- Понятийные – это набор понятий, которыми пользуются при решении конкретной задачи. Этот тип знаний вырабатывается в фундаментальных науках и теоретических разделах прикладных наук.
- Конструктивные – это знания о наборах возможных структур объектов и взаимодействии между их частями. Получение этого типа знаний характерно для техники и большей части прикладных наук.
- Процедурные знания – это используемые в выбранной предметной области методы, алгоритмы и программы, полезные для данного конкретного приложения, которые можно использовать, передавать и объединять в библиотеки.
- Фактографические – количественные и качественные характеристики объектов и явлений.
Метазнание – это знание о знаниях, возникающее в результате сопоставления знаний. Если сопоставлять метазнания, то результатом будет метаметазнание. то есть метазнания – это знания о порядке и правилах применения знаний. На основании знаний получают метазнания, на основании метазнаний – метаметазнания и т. д.
Метазнание объектов окружающего мира. Решение проблем, охватывающих большие объемы знаний, требует умения обращаться с очень сложными и различными типами данных, как по содержанию, так и по взаимосвязи с другими элементами системы. Требуемая информация должна не только присутствовать в программных комментариях и в мыслях разработчика, но и быть доступной самой системе. Таким образом, с каждым элементарным объектом может быть связано смысловое значение – концепт. Например, в системах Месно и Mycin каждый из концептов содержит следующую информацию:
- описательную часть, которая уточняет характеристики и структуру данных;
- указатель на все известные примеры концепта;
- связи с другими концептами;
- указатель в иерархии схем на группу концептов того же семейства.
Метазнание стратегий. Впродукционных системах стратегии также представлены в форме метаправил, поскольку они затрагивают сами правила. Они являются изолированными и доступными для системы. Эвристические законы управления поиском решения используют эти метаправила в качественном и декларативном виде, вместо того чтобы использовать количественные оценки. С применением числовых оценочных функций связан риск ошибки: они плохо читаемы, отражаемый ими частичный порядок приводит к сложным вычислениям, любая модификация приводит к возможности появления ошибки.
Стратегии, заданные в форме метаправил, являются более четкими и определенными. Выводы метаправил указывают на действия, которые необходимо предпринять в рассматриваемой ситуации. Таким образом они реализуют полезный потенциал, заключенный в множестве правил, и дают двойной эффект. Правила сначала группируются в подмножества. Каждое подмножество предназначено для определенной обработки и используется при выполнении соответствующих условий. Соответствие между конечными классами и подмножествами правил устанавливается с помощью правил заданий, которые составляют второй уровень знаний. Эти правила определяют, как следует выполнить данное задание наилучшим образом.
Работа Виленски (1981) «Метапланирование» посвящена управлению планами действий, независимо от области применения. Он предложил мета-стратегии для разрешения конфликтов между планами, а также рассматривает рекуррентные и конкурентные планы. Одно и то же знание представлено в декларативной форме в двух различных программах Рам и Pandora. Одна из них составляет планы для решения задач, другая должна его понять и составить планы для участвующих в действии объектов.