Структура словаря (с примерами).




Пример табл аффиксов для окончаний (процедуральный способ представления лексич знаний):

       
Окончание (флексия) Аффикс ого Ом
Часть речи Прил Сущ
Падеж Род/в Твор
Число ед ед
Род М/ср М/ср
Время люб люб
Пассивн.    

 

Инструментальный комплекс для создания статических СОЗ (ЭС) на примере Level 5 Object. Система Level 5 Object представл собой современное инструм ср-во (ИС) для поддержки разработки и сопровождения СОЗ. Ср-ва Level 5 Object позвол выводить непротиворечивые, обоснованные рекомендации на основе исх ситуации и БЗ о проблемной обл. Level 5 Object содержит интегрированный набор таких мощных ср-в автоматизации построения СОЗ как: - объекты, обеспечивающие эффективное ОО программир; - комплексные логич возможности, включая правила, демоны, управление целевыми атрибутами, процедурные и непроцедурные модули; - редакторы разработки графич интерфейса пользователя; - доступ к БД и внеш программам, арх клиент-сервер с богатыми возможностями; - полный набор интегрир ср-в отладки, включая пошаговое вып, контрольные точки, трассировку и объяснение. Система Level 5 Object успешно примен для создания приложений в статич проблемных областях. Представление лингвистических знаний (основные понятия). Способы задания декларативных синтаксич знаний: 1. Синтаксич отнош (предикативные отнош – между сказ и подлеж; копплективные отнош – их 6 шт, отнош между сказ и его дополнением; обстоятельственные отношения – между сказ и обстоятельством; определительные – подлеж-опред; количественные; отрицательные; вспомогательные). 2. Синт комп модели упр (МУ): МУ – особая зона словарной статьи, в котор помещена синтаксич и семантич инф о конкрет лексемме. Число и содержание мест МУ завис от: - числа и хар-ра актантов ситуации, обознач данным словом (семантич валентность слова); - числа и хар-ра дополнений, завис от данного слова и реально наблюд в тексте (синтаксич валентность слова). МУ = семантич валентность слова + синтаксич валентность слова. МУ: индивидуальная, групповая, ядерная. Актанты ситуации – опред лексико-графич анализом ситуации. Пр см на обороте. Агент (А) – одуш возбудитель действия; контрагент (К) – сила, против котор направл действие; объект (О) – вещь, котор явл объектом действия; адресат (D) – лицо, в пользу или во вред котор соверш действия; инструмент (I) – неодуш предмет/сила составл причину действия/состояния; результат (R) – вещь, котор возник в р-те действия.

Представление лингвистических знаний (основные понятия).

. Предложение рус языка с тз семант структуры: П = Р(А1…А6) + R, где Р – предикатно-актантная структура, R – распространитель, не влияет на понимание ситуации. Глаголы, краткие прилаг, отглагольные сущ, дееприч, причастия – облад св-ми предикативности. Числительные, наречия, союзы, частицы, знаки препинания – не облад. Кроме семант валентности задаются еще способы их выражения. Примеры глубинных падежей (семантич вал): колотить – 4-х валентный предикат. A, B, C, D – актанты.

  А(агент) В(адресат/тема) С(инструмент) D(поражаемая часть объекта)
  Кто колотит? Sим Sин (кого колотят?), *, ** Sтв По, Sдат
  одуш Одуш, *, ** Физич объект Часть тела объкта В.+
Представление лингвистических знаний (основные понятия). 1 – синт комп, 2 – семант комп. Sим – сущность в им падеже. 1* - предлог ПО, треб после себя сущ в дат падеже (ПО, Sдат), 2* - неодуш. 1** - в, Sвинит (колотить в дверь), 2** - преграда. 2+ - Иван колотит Петра кулаком по спине. 3. Лексические ф-ции– инф о лексич сочетаемости отд словоформ. Например синонимия: syn(красивый)=(симпотичный); конверсия: conv(пугать)=(бояться); дереваты: der(вышивать)=(вышивка). Критерии выбора формализма для представления знаний 8 критериев (рекомендаций) по выбору модели представления знаний: 1.если понятия простые и отношения между ними выраж в языке исчисления предикатов и способ рассуждений дедуктивный, то целесообразно использовать логические модели. 2.если понятия явл в основном простыми и есть небольшое число отношений на понятиях и способ рассуждений индуктивный, то целесообразно исп индуктивные модели. 3.если понятия усторены сложным образом и есть большое число отношений на понятиях и способ рассуждений – выдвижение гипотез, то целесообразно использовать сетевые модели. 4.если понятия устроены сложным образом и есть небольшое число отношений на понятиях и способ рассуждений дедуктивный, то целесообразно исп наследственно-конечные модели. 5.если понятия устроены сложным образом и большое число отношений на понятиях и способ рассуждения по аналогии или дедуктивный, то целесообразно исп фреймовые модели. Критерии выбора формализма для представления знаний 6.если понятия устроены простым образом и большое число отношений на понятиях и способ рассуждений дедуктивный, то целесообразно использовать продукционные модели. 7.если понятия устроены сложным образом и структура многих понятий не ясна и способ рассуждений – выдвижение гипотез, то целесообразно исп сетевые модели. 8.если понятия устроены сложным образом и есть большое число отношений на понятиях и способ рассуждения индуктивный, то подходящий формализм отсутствует. Критерии выбора модели представл знаний с точки зрения классификации знаний по «глубине» и «жесткости»: 1.если представляемые зн явл поверхностными и жесткими, то целесообразно использовать логические модели. 2.если представл зн явл поверх и мягкими или жесткими, то целесообразно исп продукционные модели. 3.если представл зн явл глубинными и мягкими или жесткими, то целесообразно исп модели в виде семантич сетей или фреймов.
Структура диалога: глобальная, тематическая, локальная Цели, преследуемые участниками диалога, определяют структуру диалога. Три уровня рассмотрения структуры диалога: 1.глобальный (глоб структура определяется общими св-вами решаемых пользователями задач); 2.тематический (тематическая структура диалога зависит от конкретных особенностей решаемой задачи, т.е. от алгоритма ее решения (разбиением задачи на подзадачи), и распределения ролей (активная и пассивная) межу участниками общения при решении отд подзадач). 3.локальный уровень (рассматриваются отдельные шаги диалога, образуемые взаимосвязанными высказываниями его участников). Шаг диалога – пара «действие-реакция», где высказывание активного участника – действие, а пассивного – реакция. Основные параметры структуры диалога на данном уроне: 1. Инициатор шага и вид инициирования; 2. Способ влияния действия на реакцию; 3. Способ спецификации задачи, решаемой на данном шаге. Перехват инициативы возникает когда пассивный участник вместо преследования цели, предложенной активным уч, предлагает преследовать иные цели. Т.о. происходит разрыв первоначально инициированного шага диалога и открывается поддиалог (происходит смена цели (темы) диалога). Структура диалога: глобальная, тематическая, локальная На уровне 1 действия ИДС задаются в виде посл-ти этапов, опред в завис от класса решаемых задач. Например, в случае общения с ЭС глоб структ вкдлюч след этапы: 1.инструктыж, 12.определение задачи, 3.решение задачи, 4.объяснения в ходе решения задачи, 5.выдача резуль решения задачи и его оценка, 6.объяснения после решения задачи, 7.определение причин неудачи и приобретение новых знаний. В силу простоты и статичности глоб структуры она встраивается в управляющий механизм диалогового компонента (т.е. задается процедурно). Тематич структ диалога представляется в виде сценария, в рамках котор определяются: 1.структура задачи; 2.распределение подзадач по участникам общения; 3.языковые ср-ва, используемые при обращениях к пользователю. Для задания тематич структ (сценария) диалога в примен различ способы, котор группир в три класса: 1.сценарий присут в системе в готовом виде; 2.сц генерируется сист в процессе решения задачи; 3.некоторые компон сц присут в сист в готовом виде, а некоторые генерируются. Рассм 1 способ: готовый сц м.б. задан в виде частично упорядоченного мн-ва правил с параметрами, значения которых устанавливаются в процессе решения конкретной задачи. Структура диалога: глобальная, тематическая, локальная Использование готовых сц целесообразно, когда к сист предъявляются жесткие требования по быстродействию, а реш задачи имеют жесткую структуру и заранее известны роли уч общения. 2-ой способ: в диалоговый компонент включается спец механизм вывода (планирования). Метод планир опред в завис от исп в конкрет ИДС системы представления знаний. Генерацию сц диалога целесообразно исп в тех случаях, когда структура задчи завис от контекста ситуации, в котор происх решение, а полный перечнь ситуаций не м.б. определен заранее. На лок уровнезадача диалогового компонета состоит в определении параметров текущего шага. Действия пользователя делятся на задания и команды. Задания предусматривают формулировку решаемой задачи и ввод необх для ее решения параметров. Команды служат для перехвата инициативы или для вып технологич действий. Если инициатива принадл сист, то вид используемого действия определ исходя из того, насколько диалоговому компонету известна ф-ция (и/или параметры), с пом котор осущ решение подзадачи на данном шаге. Промышленная технология создания СОЗ (ЭС). 1.фаза проектирования. 1.1.инициализация проекта СОЗ, 1.1.1.составление плана-графика создания системы, 1.1.2.опред потенциальной доступности аппарат и програм ср-в для разработки, 1.1.3.определение наличия и доступности экспертов, 1.1.4.планир способов управл ходом разработки и способов взаимод между разраб. 1.1.5..планир работы будущей СОЗ совместно с имеющимися у заказчика др системами, 1.1.6.опред возмож трудностей и огранич при разраб и установке сист. 1.2.формирование группы разработки, 1.2.1.определение состава группы в кол-ве 4-6 чел (руководитель, ассистент руковд, 1-2 инж по зн, 1-2 программиста (ассист инж по зн)), 1.2.2.изучение возмож привлечения специалистов по конкрет носителям машин источников инф, 1.3.опред треб к сист, 1.3.1.опред чтеких представлений о среде, в кот будет работать СОЗ, 1.3.2.выяснение треб к СОЗ со стороны рук-ва, экспертов, пользователей и разраб. 1.3.3.формулир треб к ср-вам разработки, эксп, опреац среде, интерф, дисциплине поддержки и тд. Промышленная технология создания СОЗ (ЭС). 1.4.проведение исследований по выполнимости проекта, 1.4.1.технич предпосылки, 1.4.1.1.пригодность задачи для ее решения с пом СОЗ, 1.4.1.2.характеристики знаний с тз оценки пример размера БЗ, слож структуры зн, времени, необх для получения зн, 1.4.1.3.интерфейсы будущ сист (формы взаимод СОЗ с разл категориями пользователей, интерф между разными СОЗ, интерф между СОЗ и внеш БД или оборудованием), 1.4.2.экономич предпосылки. 1.4.2.1.оценка расходов на созд СОЗ, 1.4.2.2.оц расх на поддержку СОЗ, 1.4.3.культурные предпосылки. 1.5.разраб общей концепции сист-мы. 1.5.1.разраб структуры БЗ и механизмов рассуждения, 1.5.2.выбор програм и аппарат ср-в для разработки сит-мы, 1.5.3.разраб способа переноса СОЗ на реальное оборудование и в реальную рабочую среду, 1.5.4.опред критериев оценки функционир сит-мы. 2.фаза разработки (по методу прототипирования). Нач стадия (разраб 1-ого прототипа на основе концепции, выбр на фазе1), промежут стадия (создание на базе 1-го прототипа серии прототипов с последовательно улучш хар-ми), финальная стадия (разраб сист-ма, служащая основой для перевода в головной образец). Промышленная технология создания СОЗ (ЭС) 2.1.общие соображения по прототипированию, 2.1.1.вбор доста широты и глубины проработки задачи для данного прототипа. 2.1.2.привлечение конечных польз к работе над прототипом, 2.1.3.организация эффективного взаимод в группе разработки, 2.1.4.проведение оценки функционирования очередного прототипа,. 2.2.виды стратегий прототипирования, 2.2.1.создание начального прототипа для всей задачи в целом, его тестирование и отладка сист-мы на серии послед прототипов. 2.2.2.создание прототипа, облад на поверхн уровне всеми функциональными возможностями для всех подзадач, его тестирование. 2.2.3.создание прототипов для каждой подзадачи, поочередное тестирование каждого из прототипов, затем их объединение. 2.3.документирование разраб. 2.4.прототипирование с исп 1-й стратегии (по аналогии с исп 2-й и 3-й стратегии). 3.фаза внедрения. 3.1.создание на базе финального прототипа головного образца, опирающегося на реальную раб среду, 3.2.перенос сит-мы из среду разработки в среду функционирования у заказчика. Уровни изучения текста: основные понятия, треугольник Фрэге Уровни изучения языка:1. Дискурс (в сист поним слитной речи и обраб текстов). 2. Уровень предложения. 3. Уровень словосочетаний. 4. Слово. 5. Морфизмы – значащая/незначащая часть слова (приставки). Треугольник Фрэге. S – обознач знак – характериз с одной стороны обознач им предметом D (денатат, референт), а с др стороны св-ми этого денатата C (концепт/десигнат, смысл). D – то, что чел наблюд в реальной жизни; C – набор св-в, присущих только рассм предмету. Омонимия:знак S назыв омонимом, если ему соотв разные концепты C (коса, замок, ядро, стекло). Синонимия: один и тотже денатат D имеет разные знаки (вода – H2O). Пресуппозиция: наличие в неречевых условиях некоторого речевого акта, связ с произнесением текста. Анафирические ссылки: использование указательных местоимений (возьми эту книгу), пропуски текста. Знаковая система м.б. представл в виде Z=<SUKI>, где S – мн-во знаков данной сист; U – универсум, т.е. мн-во всех денататов языка; K – сист знаний, т.е. мн-во понятий, в котор опис концепты и их взаимоотнош; I – мн-во интерпретаций, соотнос знаку либо его денатат, либо его концепт.
Модель управления (МУ), задание МУ в словаре Синт комп модели упр (МУ): МУ – особая зона словарной статьи, в котор помещена синтаксич и семантич инф о конкрет лексемме. Число и содержание мест МУ завис от: - числа и хар-ра актантов ситуации, обознач данным словом (семантич валентность слова); - числа и хар-ра дополнений, завис от данного слова и реально наблюд в тексте (синтаксич валентность слова). МУ = семантич валентность слова + синтаксич валентность слова. МУ: индивидуальная, групповая, ядерная. Актанты ситуации – опред лексико-графич анализом ситуации: Агент (А) – одуш возбудитель действия; контрагент (К) – сила, против котор направл действие; объект (О) – вещь, котор явл объектом действия; адресат (D) – лицо, в пользу или во вред котор соверш действия; инструмент (I) – неодуш предмет/сила составл причину действия/состояния; результат (R) – вещь, котор возник в р-те действия. Словарь –совок индивид знаний. Модель управления (МУ), задание МУ в словаре Словарная статья:
     
     
год Сущ, люб, м, неодуш время
Железнодорож. прил Характер. Трансп ср-ва
перевез Гл,..,.., люб актив Модель управл

1 – заглавная зона; 2 – морфологич зона; 3 – синтактико-семантич зона; 4 – основа словаря; 5 – часть речи, число, род; 6 – лексич ф-ции, семантич признаки, категории, классы.

Обзор языка представления знаний Level 5 Object. Формальное описание продукционной системы (нотация BNF): <правило>::= (если <условие> то <действие> иначе <действие>); <условие>::= (и {<предложение>}); <предложение>::= (или {<предложение>}) | (<предикат> <тройка>); <тройка>::= (<объект> <атрибут> <значение>); <действие>::= {<значение> | <процедура>}; <значение>::= (<тройка> <коэф опред>). Методы и демоны в системе Level 5 Object: Метод –серия команд, котор связаны с нек атриб. Здесь методы исп для определения значения атриб, когда этот атриб кем-то запрашивается (метод WHEN NEEDED), или для выполнения ряда действий, когда знач атриб изменяется (метод WHEN CHANGED). Знач атриб измен всякий раз, когда ему присваивается знач. Метод WHEN CHANGED вып сразу после получения значения атрибутом. Методы WHEN NEEDED и WHEN CHANGED имеют одинак синтаксис: WHEN CHANGED/ WHEN NEEDED BEGIN [IF выражение] [WHILE выражение] [DO выражение] [FOR выражение] [команда] END Обзор языка представления знаний Level 5 Object. Демон – последовательность команд, напис на процедурном языке, котор вып при наступлении опред события, т.е. демон запуск каждый раз, когда услов, запис в части IF станов истинным. Это услов провер каждый раз, когда атриб, на котр идет ссылка в этом условии, получ значение в результ работы приложения. DEMON <имя демона> <команда> IF <условие> [AND <условие>…] [OR <условие> …] THEN <заключение> Правило: RULE <имя правила> <команда> IF <условие> [AND <условие> [AND <условие>… ]] [OR <условие> [OR <условие> … ]] THEN <заключение> [ELSE <альтернат заключ>] [AND <альтернат заключ> [AND <альтернат заключ>… ]]. Формальная постановка задачи создания ИДС. Wвх – мн-во вх текстов подъязыка (язык конкрет группы людей), обслуж конкрет проблем обл. Wвых – мн-во команд доступа к БД; - мн-во вызовов прикладных программируемых модулей. Под пониманием (обработкой) текстов вх языка понимается построение трех отображений: 1. - перевод нек факта окр мира (j*), - анализ вх текста. 2. - семантич интерпр (j**), - трансформация «очищенного» логико-смыслового gj на язык предст знаний. 3. - прагматическая интерпретация (j***); (RiÎR), где R – мн-во команд вызова. Лингвистическая модель входного подъязыка и средства ее Реализации Лингвистическая модель входного подъязыка: Lm = <V,G,S>, где V – лексич компон, опред лексику вх подъязыка; G – синтаксич компон, опред порождение правильных конструкций этого языка; S – семантич компон, опред способ записи нек смысл структуры. Арх компон понимания вх языка (ЕЯ-сист): текст® морфологич анализ вх текста (V, j*)® синт ан (G, j*)® семантич ан (S, j*)® семантич интерпр (j**)® прагматич интерпр (j***). синтактика – изуч структурные аспекты сочетаний знаков данной сист, правила их образования и преобразования (безотносительно к их ф-циям и значениям); семантика – рассм знаковые системы как ср-ва выражения смысла, т.е. занимается установл завис между структ знакосочетаний и их выразительными возможностями, изуч сочетания знаков. образ осмысл тексты; Лингвистическая модель входного подъязыка и средства ее Реализации Под пониманием (обработкой) текстов вх языка понимается построение трех отображений: 1. - перевод нек факта окр мира (j*), - анализ вх текста. 2. - семантич интерпр (j**), - трансформация «очищенного» логико-смыслового gj на язык предст знаний. 3. - прагматическая интерпретация (j***); (RiÎR), где R – мн-во команд вызова.
Методы и демоны в системе Level 5 Object. Метод –серия команд, котор связаны с нек атриб. Здесь методы исп для определения значения атриб, когда этот атриб кем-то запрашивается (метод WHEN NEEDED), или для выполнения ряда действий, когда знач атриб изменяется (метод WHEN CHANGED). Знач атриб измен всякий раз, когда ему присваивается знач. Метод WHEN CHANGED вып сразу после получения значения атрибутом. Методы WHEN NEEDED и WHEN CHANGED имеют одинак синтаксис: WHEN CHANGED/ WHEN NEEDED BEGIN [IF выражение] [WHILE выражение] [DO выражение] [FOR выражение] [команда] END Методы и демоны в системе Level 5 Object Демон – последовательность команд, напис на процедурном языке, котор вып при наступлении опред события, т.е. демон запуск каждый раз, когда услов, запис в части IF станов истинным. Это услов провер каждый раз, когда атриб, на котр идет ссылка в этом условии, получ значение в результ работы приложения. DEMON <имя демона> <команда> IF <условие> [AND <условие>…] [OR <условие> …] THEN <заключение> Демон м.б. исп для проверки правильности ввод пользователем значений. Методы не м.б. привязаны к атриб системных классов. Методы более пригодны для написания сложных процедурных инструкций, т.к. могут состоять из вложенных процедур. Семантический анализ текста Основ задача – реализация заключит стадии преобразов вх предложения во внутр представление. Семант анализ: - слов, имеющих модель управления (напр, купить – значение однозначно); - слов, не имеющих модель управл (значение завис от контекста, напр, газовый). Предикаты: - пред действия (отраж ситуацию в реальном мире); - функциональные (операторы над предикатами); - пустые пред (к ним относ глаголы-связки (быть), пустые глаголы (осуществить, произвести) и фазовые глаголы (начинать, заканчивать), модальные глаголы (мочь, должен, хотеть). Явление канонизации – из группы однотипных предикатов выбир канонич предикат. Обобщенный алгоритм семант анализа:1. Для слов, имеющих МУ производ классифик всех слов на след группы (в завис от исп модели предсиавл заний): действие, состояние, фазовые, пустые, функцион, модальные. 2. Осущ перенос предик, комплективных и обстоят отнош на слово, явл предикатом действия. 3. Осущ выбор канонич формы слова с МУ. 4. Замена синтаксич отнош вх МУ на семантич отнош и проверка замены по семантич сети/по фрейму. 5. Дополнительно обстоят синтакс отнош обрабат как инф вспомогат к данному предикату действия. 6. Производ заполение всех актант МУ в соотв предложении при наличии в запросе парам, котор хран в БД, на этом этапе производ обращение к БД. Общая характеристика иерархии классов, иерархии модулей и иерархии рабочих пространств системы G2 Сущности и иерархия классов. Класс – основа представления зн в G2. Структуры данных представл в виде классов объектов (определений объектов), имеющих определенные атрибуты. Классы наслед атрибуты от суперклассов и передают свои атриб подклассам. Каждый класс (кроме корневого) может иметь конкретные экземпляры. Описание класса включ ссылку на суперкласс (is-a-иерархия) и перечень атрибутов, специфичных для класса (part-of-иерархия). Иерархия классов берет свое начало от корневого класса item-or-value. Он имеет два производных класса item (- корень разветвленной иерархии классов) и value (типы данных G2). Каждый из этих классов имеет свои производные классы. Общая характеристика иерархии классов, иерархии модулей и иерархии рабочих пространств системы G2 Иерархия модулей и рабочих пр-в.G2-приложение структурируется с пом модулей и рабочих пр-в на легко управляемые части. Приложение м.б. организованно в виде одной БЗ или в виде неск БЗ, назыв модулями. Модули приложения организованы в древовидную иерархию с одним модулем верхнего уровня. Модули след уровня состоят из модулей, без которых не может работать модуль предыдущего уровня. Рабочее пр-во – контейнерный класс, в котор размещ др классы и их экземпляры. Каждый модуль может содержать любое кол-во рабочих пр-в. Раб пр-ва образуют одну/несколько древовидных иерархий с отношением is-a-part-of (является частью). Различие между модулями и раб пр-вами:модули раздел приложения на отд БЗ, совместно исп в разл приложениях. Раб пр-ва вып свою роль при исполнении приложения. Они содежат в себе (и в своих подпр-вах) различ сущности и обеспечивают разбиение приложения на небольшие части, котор легче понять и обрабатывать (напр, весь процесс разбивается на подпроцессы, и с каждым из них ассоциируется свое подпр-во). Аспекты общения в СОЗ, классификация конечных пользователей. Общение (коммуникативное взаимодействие, диалог) – процесс достижения его участниками определенных согласованных целей путем обмена связанными высказываниями, выраженными, выраженными в языке, о некотором реальном/гипотетическом мире (проблем обл). Если диалог между пользователем и ЭВМ, то общение – процесс обмена взаимосвязанными высказываниями, выраженными в языке, направл на достижение целей пользователя (на удовлетвор его информ потребностей). Высказывания участников общения образуют связанный текст (дискурс), имеющий сложную структуру. 3 аспекта общения в СОЗ:1.виды общения пользователя (режим консультации (основной режим), режим приобретения знаний, объяснение (почему принято такое решение). 2.формы общения пользователей (язык общения): ЕЯ, формальный/искусственный язык, многооконная графика, гипертекстовые ср-ва, система меню. 3.возможности подсистемы объяснений: установки степени помощи, ретроспективные объяснения, встроенные объяснения. Аспекты общения в СОЗ, классификация конечных пользователей. Классификация пользователей.На нач этапе непоср взаимод с ЭВМ осуществляли только программисты; специалисты др областей – потребители результатов, полученных на ЭВМ, выступали в роли косвенных конечных пользователей (общались с ЭВМ через программистов). По мере расширения сферы исп ЭВМ конечные пользователи стали вовлекаться в процесс непосредственного взаимод с ЭВМ. Это привело к появлению массовой категории пользователей – прямых конечных пользователей, раб в диалоговом режиме (специалисты в различ проблем областях). Как правило, эти пользователи не обладают знаниями в области электронной обработки данных и не умею программировать, их часто называют неподготовленные конечные пользователи.
Извлечение знаний: основные термины, понятия, аспекты, классификация методов извлечения знаний. Приобретение знаний – процесс получения зн от эксперта или др источников и передача их в СОЗ. Три стратегии получения знаний при разработке СОЗ: 1. Без применения комп. 2. С использованием спец. прогр. средств. 2.1. Извлечение знаний (стратегия1) 2.2. Приобретение знаний (стратегия2) 2.3. Формирование знаний (стратегия3) Три правила: 1.если при разраб СОЗ процесс получения зн от экспертов осущ без исп комп ср-в путем непоср контакта инж по зн и ист знаний, то уместно говорить об извлечении зн. 2.если при разраб СОЗ процесс получ зн от ист знаний осущ с исп спец програм ср-в, то уместно говорить о приобретении зн. 3.если при разраб СОЗ процесс получения зн от ист знаний осущ с исп программ обучения при наличии репрезентативной (достаточно представительной) выборки примеров принятия решений в предмет обл, то уместно говорить о формировании зн. Извлечение знаний: основные термины, понятия, аспекты, классификация методов извлечения знаний Приобретение зн характер след аспектами: 1.фазы приобретения зн. 2.модели приобретения зн. 3.номенклатура приобретения зн. 4.уровни зн. 5.ср-ва отладки зн. Большинство исследователей выдел три фазы, отраж изменение ф-ций участников проектирования СОЗ (инж по зн и эксперта): 1.предварит фаза – фаза извлечения зн из источника на домашинных этапах разраб СОЗ (идентификация проблемы, получение зн, структурирование,формализация); 2.нач фаза – фаза приобретения зн, котор осущ на этапе реализации прототипа СОЗ и обеспечивает наполнение СОЗ знаниями об области экспертизы; 3.фаза наполнения – фаза, вып на этапах реализации и тестирования, связана с решением таких задач, как: обнаруж неполноты, неточности или противоречивости, используемых СОЗ; извлечение новых зн, устраняющих обнаруженные «нефакторы»; преобразование новых зн в вид, понятный СОЗ. Извлечение знаний: основные термины, понятия, аспекты, классификация методов извлечения знаний Схема передачи зн в СОЗ: область экспертизы (действительность)→ модель мира эксперта→ модель мира инж по зн→ поле знаний→ модель зн в СОЗ. Где: модель мира инж по зн + поле знаний = получение знаний; модель мира инж по зн = этап извлечения зн; поле знаний = этап структурирования зн; модель зн в СОЗ = этап формализации. Классификация методов извлечения знаний: 1.извлечение зн. 1.1.коммуникативные методы; 1.2.текстологические методы (инкрементальный (пошаговый) анализ текста; броузинг (просмотр) текста по сигнализирующим лексемам и синтаксич конструкциям). 1.1.1.прямые; 1.1.2.косвенные (многомерное шкалирование; иерархическая кластеризация; построение взвешенных ситуаций; ранжирование деревьев выбора; анализ репертуарных решеток). 1.1.1.1.пассивные (наблюдения: за реальным процессом, за имитацией; анализ протоколов «мыслей вслух»; лекции); 1.1.1.2.активные. 1.1.1.2.1.групповые (круглый стол; «мозговой штурм»; экспертные игры (ролевые игры в группе); 1.1.1.2.2.индивидуальные (анкетирование; интервью; свободный диалог; игры с экспертом). Синтаксический анализ текста (общий алгоритм). Задача СИА: используя морфологич инф о словофрмах, получ на этапе морф анализа, и сведений из словаря построить семантич структуру вх предложения. Синт структура отраж синт связи между словами в предлож. Дерево зависимостей: пусть х – непустая произвольная цепочка, Х – мн-во вхождений словоформ в цепочку х. Тогда произвол бинарное отношение ® на Х, при котором граф <Х®> явл деревом назыв отношением зависимости на Х, а само дерево – дерево завис. Синтаксический анализ текста (общий алгоритм). Общий алгоритм синтаксич анализа для подъязыков деловой прозы:1. Процедура устан синт отнош. В первую очередь опред предикативные (между сказ и подлеж), копплитивные (между сказ и дополн) и обстоятельственные (между сказ и обст) синт отнош. Для этого в предлож выдел словоформы, не вход в придаточное предложение и обороты. 2. Среди словоформ основ уровня выдел предикаты (ими м.б.: глаголы, краткие прилаг, отглагольные сущ, дееприч, прич и нек предлоги; непредикаты: сущ, числит, наречия, союзы, частицы и местоим). 3. Для каждого предик выд и посл-но обраб соотв ему групповые, ядерные и индивид МУ (МУ -–особая зона слов статьи, в котор помещена синт и семантич инф о конкрет слове). 4. Для каждой индивид МУ выдел список кандидатов, котор удовл треб МУ в падеже, части речи и др. 5. С пом отсеив фильтров устран словоформы (не игр роль слуг), осущ формир матрицы кандидатов для каждого столбца каждой инд МУ. Сначала осущ комплектование табл предикативными, затем копплективными, затем обстоятельств отнош для места и времени, исп спец фильтр, чтобы не перепутать именные группы. 6. Обрабат словоформы др уровней Классификация СОЗ (ЭС), структура типовой СОЗ (ЭС). Структура типовой СОЗ (ЭС). Структура традиционной статич СОЗ: решатель, рабочая память, БЗ, компонент приобретения знаний, объяснительный компонент, диалоговый компонент (средства общения). В статич СОЗ не учит изменения окр мира, происход во время процесса решения задачи (вх данные не измен во время работы СОЗ, значения др данных изменяются только СОЗ). Структура динамич СОЗ (учит динамика, те изменения во время работы СОЗ): структура статич СОЗ + подсистема моделирования внеш мира + подсистема связи с внеш окружением (осущ связь с внеш миром через сист датчиков и контроллеров) + подвергаются изменениям БЗ и решатель. Классификация СОЗ: 1.по степени реализации: 1.1. прототипы 1.1.1. Демонстрационный (50-100 правил, 3 мес) 1.1.2. Исследовательский (200-500 правил, 1-2 года) 1.1.3. Действующий (500-1000 правил, 2-3 года) 1.2. Промышленные системы (500-1500 правил, 2-4 года) 1.3. Коммерческие системы (1000-3000 правил, 3-5 года) Классификация СОЗ (ЭС), структура типовой СОЗ (ЭС). 2.по степени сложности: 2.1. Поверхностные (используют знания в виде правил типа «условие→ действие») 2.2. Глубинные (используют более сложные модели представления знаний) 3. по степени интеграции с др программными системами: 3.1. Традиционные (автономные) исп только методы СОЗ 3.2. Интегрированные (СОЗ+САПР, СОЗ+СУБД, СОЗ+ППП) 4.по сложности и типу ЭВМ: 4.1. простые - поверхностные СОЗ - традиционные СОЗ - выполняются на ПЭВМ - коммерч стоимость 100-25000 $ - стоимость разраб 50000-300000 $ - время разраб 3-12 мес кол-во правил 200-1000 4.2. сложные - глубинные СОЗ - интегрированные СОЗ - выполняются на символьных ЭВМ, рабочих станциях, мощных универсальных ЭВМ - стоимость разраб 5-10 млн $ - время разраб 1-5 лет - кол-во правил 200-1000
Классификация СОЗ (ЭС), структура типовой СОЗ (ЭС). 5.по типу области экспертизы 5.1. Динамические (в противном случае) 5.2. Статические - если исходная инф не меняется в процессе решения задачи - если задача не изменяет исходных данных в проц ее решения 6.по эволюции развития: 1поколение (простые СОЗ)→ 2поколение (сложные статические СОЗ)→ 3поколение (сложные динамические СОЗ) 7.по типам решаемых задач: СОЗ: обработки данных на основе знаний (интерпретация данных, диагностирующие, мониторинговые), формирования данных на основе зн (прогнозирующие, планирующие, проектирования), обработки и формир данных и зн (обучающие, управл), обраб и формир знаний на основе метазаний (оболочки, инструмент сист) Подъязык деловой прозы, его основные свойства (с примерами). Рассм язык как ср-во общения и язык с т.з. его структуры. Язык – наход в распоряжении того/иного коллектива система элементов-единиц разных ярусов (слов, значимых частей слов и тд) + сист правил функционирования этих единиц. Система единиц – инвентарь языка, система правил функционирования языка (правил генерации и понимания выск) – грамматика языка в широком смысле. Подъязык– язык конкрет группы людей. Св-ва (подъязыка деловой прозы): 1. Относительная полнота: если подъязык, обусл конкрет ПО, облад дост набором языковых ср-в для отбраж любого факта, то он относительно полон. 2. Замкнутость: если при добавлении к выборке текста подъязыка др текстов подъязыка не происх пополнения словаря, то такой подъязык облад св-вом замкнутости. 3. Конечность: если подъяз имеет конечный/огранич словарь. То он облад св-вом конечности. 4. Формальная ограниченность: если в подъязыке ограничен набор языковых ср-в из общеязыкового арсенала, то он облад св-вом форм огр. 5. Устойчивость: если для понимания текста вх подъязыка не сущ поверхностных синт различий фраз с тождеств смыслом, то он облад св-вом устойчивости (напр, ветер колышет траву/трава колышется ветром). Модели приобретения знаний, модель «идеального» эксперта. Последовательность задач: 1.определение необход модификации (расширения) знаний СОЗ; 2.осуществление извлечения новых знаний в случае необход такой модифик (либо окончание процесса приобретения в противном случае); 3.преобразование новых знаний в форму, «понятную» СОЗ; 4.модифик зн СОЗ и осущ перехода к вып 1-ой задачи. В завис от того, кто вып. конкрет задачу, выд различ модели приобретения зн, отраж разл уровни автоматизации процессов решения задач 1-4. 1.Модель приобр зн с пом инжененра по зн: эксперт взаимод с сист непоср/с пом инж по зн, причем задачи1 и 2 они реш совместно, а зад3 реш инж по зн. Автоматизировано только реш зад4. 2.Модель приобр зн с пом интеллект редактора: эксперт решает зад1 и 2, а зад3 и 4 выполняются уже автоматизир способом. 3.Мод приобр зн с пом индуктивной программы: СОЗ приобретает зн по аналогии с человеком-экспертом. Индуктивная прогр анализир данные, содержащие сведения о предмет обл, автоматич формирует отнош и правила, опис эту обл. предполагается, что в БЗ в явном виде хран конкрет факты, а индукт прогр делает обобщения. Т.о. автоматизир вып всех 4-х задач. Модели приобретения знаний, модель «идеального» эксперта. 4.Мод приобрет зн с пом программы понимания текста: - самая слож модель; автоматизир вып всех 4-х задач. Самые распр модели – 1 и 2. Модель «идеального» эксперта – личностный портрет в виде набора критериев, которым должен соотв чел, претендующий на роль эксперта по решению конкрет класса задач. Критерии отбора специалиста-эксперта: эксп четко осознает границы своих познаний; эксп может ответить на поставленный вопрос, если он поставлен в этих границах; эксп обычно не ошибается; эксп можно попросить оценить значение нек парам, неподдающегося прямому измерению, и доверять этой оценке; эксп облад некотор моделью предмет обл, и е<


Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-08-20 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: