Декларативные синтаксические знания: модель управления




Предложение рус языка с тз семант структуры: П = Р(А1…А6) + R, где Р – предикатно-актантная структура, R – распространитель, не влияет на понимание ситуации. Глаголы, краткие прилаг, отглагольные сущ, дееприч, причастия – облад св-ми предикативности. Числительные, наречия, союзы, частицы, знаки препинания – не облад. Кроме семант валентности задаются еще способы их выражения. Примеры глубинных падежей (семантич вал): колотить – 4-х валентный предикат. A, B, C, D – актанты.

  А(агент) В(адресат/тема) С(инструмент) D(поражаемая часть объекта)
  Кто колотит? Sим Sин (кого колотят?), *, ** Sтв По, Sдат
  одуш Одуш, *, ** Физич объект Часть тела объкта В.+

1 – синт комп, 2 – семант комп. Sим – сущность в им падеже. 1* - предлог ПО, треб после себя сущ в дат падеже (ПО, Sдат), 2* - неодуш. 1** - в, Sвинит (колотить в дверь), 2** - преграда. 2+ - Иван колотит Петра кулаком по спине.

3. Лексические ф-ции – инф о лексич сочетаемости отд словоформ. Например синонимия: syn(красивый)=(симпотичный); конверсия: conv(пугать)=(бояться); дереваты: der(вышивать)=(вышивка).

Основные формы и языки взаимодействия в СОЗ (ЭС), деловая проза Формы общения пользователей(язык общения):ЕЯ, ФЯ/искусств яз, многооконная графика, гипертекстовые ср-ва, сист-ма меню.Рассм язык как ср-во общения и язык с т.з. его структуры. Язык – наход в распоряжении того/иного коллектива система элементов-единиц разных ярусов (слов, значимых частей слов и тд) + сист правил функционирования этих единиц. Система единиц – инвентарь языка, система правил функционирования языка (правил генерации и понимания выск) – грамматика языка в широком смысле. Формальный язык – язык, имеющий правила функционир элементов, строго опред всегда, т.е. форм граммат, что облегчает автоматизир анализ конструкции языка, т.е. в ФЯ огранич набор язык ср-в общеязык арсенала.   Основные формы и языки взаимодействия в СОЗ (ЭС), деловая проза Подъязык– язык конкрет группы людей. Св-ва (подъязыка деловой прозы): 1. Относительная полнота: если подъязык, обусл конкрет ПО, облад дост набором языковых ср-в для отбраж любого факта, то он относительно полон. 2. Замкнутость: если при добавлении к выборке текста подъязыка др текстов подъязыка не происх пополнения словаря, то такой подъязык облад св-вом замкнутости. 3. Конечность: если подъяз имеет конечный/огранич словарь. То он облад св-вом конечности. 4. Формальная ограниченность: если в подъязыке ограничен набор языковых ср-в из общеязыкового арсенала, то он облад св-вом форм огр. 5. Устойчивость: если для понимания текста вх подъязыка не сущ поверхностных синт различий фраз с тождеств смыслом, то он облад св-вом устойчивости (напр, ветер колышет траву/трава колышется ветром). Механизмы вывода СОЗ (ЭС) Интерпретатор (мех вывода) – управл механизм СОЗ. Его задача – на основании текущего сост раб памяти опред, какой модуль и какими данными будет работать. (схему см на обороте) По окончании работы тек модуля (правила) мех вывода проверяет условия окончания задачи, и если они не удовл, то вып очередной цикл. Каждый модуль снабжается образцом, т.е. описанием, указывающим, при вып каких условий этот модуль может приступить к работе. В общем случае работа мех вывода в каждом цикле состоит из 4-х этапов: выборки, сопоставления, разрешения конфл, выполнения. Каждый из этапов исп в работе след источники знаний: раб память, БЗ, память состояний. Инф о поведении мех вывода запом в памяти состояний. 1.Этап выборки –определений подмн-ва эл-тов раб памяти и подмн-ва правил БЗ, котор могут быть исп в тек цикле. Исп один из двух подходов: синтаксич выборка – грубый отбор знаний, данных, правил, котор м.б. полезны в тек цикле (основание для выборки – формальные зн, встроенные в сист-му разработчиком); семантич выборка – отбор зн на осн таки свед, как модель предмет обл, разбиение задачи на подзадачи, тек цели и тд. Семант зн ввод в сист экспертом в виде метаправил. В результ работы этапа происх выделение активного набора данных и активного набора правил.
Механизмы вывода СОЗ (ЭС) 2.Этап сопоставления – опред, какие активные модули и на каких актив данных готовы к работе. Модуль готов к раб, если среди актив данных есть данные, удовл услов этого модуля, указ в его образе – означенный модуль. Рез работы этапа – набор означенных модулей – конфл набор. 3.Этап разрешения конфл – механизм вывода вбир из конфл набора те означивания, котор будут вып в тек цикле. Интерпретатор оценивает означенные модули с тз их полезности при достижении тек цели. 4.Этап выполнения – осущ исполнение правил (модулей), выбранных на этапе 3. В ходе этапа осущ модификация раб памяти, вып операции ввода/вывода и измен память состояний интерпретатора. Семантический анализ текста (общий алгоритм). Основ задача – реализация заключит стадии преобразов вх предложения во внутр представление. Семант анализ: - слов, имеющих модель управления (напр, купить – значение однозначно); - слов, не имеющих модель управл (значение завис от контекста, напр, газовый). Предикаты: - пред действия (отраж ситуацию в реальном мире); - функциональные (операторы над предикатами); - пустые пред (к ним относ глаголы-связки (быть), пустые глаголы (осуществить, произвести) и фазовые глаголы (начинать, заканчивать), модальные глаголы (мочь, должен, хотеть). Явление канонизации – из группы однотипных предикатов выбир канонич предикат. Семантический анализ текста (общий алгоритм). Обобщенный алгоритм семант анализа:1. Для слов, имеющих МУ производ классифик всех слов на след группы (в завис от исп модели предсиавл заний): действие, состояние, фазовые, пустые, функцион, модальные. 2. Осущ перенос предик, комплективных и обстоят отнош на слово, явл предикатом действия. 3. Осущ выбор канонич формы слова с МУ. 4. Замена синтаксич отнош вх МУ на семантич отнош и проверка замены по семантич сети/по фрейму. 5. Дополнительно обстоят синтакс отнош обрабат как инф вспомогат к данному предикату действия. 6. Производ заполение всех актант МУ в соотв предложении при наличии в запросе парам, котор хран в БД, на этом этапе производ обращение к БД. Основные функции диалогового компонента, структура диалога Чтобы быть полноправным участником общения, ИДС должна вып след ф-ции: 1.ведение диалога (определение его структуры и роли, котор сист-ма и пользователь вып на текущем шаге диалога); 2.понимание (преобразование поступающих от пользователя высказываний на ЕЯ в выражения на языке внутр представления); 3.генерация (формирование выходных высказываний на ЕЯ). В соотв с выделенными ф-ми обобщенная схема ИДС м.б. представлена в виде 3-х компонентов: 1.диалоговый компонент; 2.компонент понимания высказываний; 3.компонент генерации высказываний. (Рис см на обороте). Диалоговый компонент. Его задачи: 1.ведение диалога; 2.формирование/обработка перехватов инициативы. Ведение диалога – обеспечить целесообразные действия системы на тек шаге диалога. По структуре и тек состоянию диалога диалог компонент формирует (если инициатива принадл сист-ие) или определяет (если инициатива принадл пользователю) тип задания (генерация вопроса, понимание ответа и его обработка, генерация утверждения и тд), вып системой на тек шаге. Основные функции диалогового компонента, структура диалога Ведение диалога вып по одной из 2-х схем: 1.диалог ведет пользователь; 2. диалог ведет система. В первом случае инициатива нах у пользователя, а для системы диалог сводится к выработке реакций на текущие высказывания пользователя. Во 2-ом случае инициатива принадл системе. Сист-ма ведет диалог в соотв с имеющимися у нее представлениями о структуре диалога (о разбиении задач на подзадачи, о том кто из участников, когда и какую подзадачу решает) и способе обмена высказываниями. Вторая задача вызвана тем, что реакции одного участника могут не соответствовать ожиданиям другого. В завис от того, кто осущ перехват инициативы, система либо его обрабатывает, либо формирует перехват. Цели, преследуемые участниками диалога, определяют структуру диалога. Основные функции диалогового компонента, структура диалога Три уровня рассмотрения структуры диалога: 1.глобальный (глоб структура определяется общими св-вами решаемых пользователями задач); 2.тематический (тематическая структура диалога зависит от конкретных особенностей решаемой задачи, т.е. от алгоритма ее решения (разбиением задачи на подзадачи), и распределения ролей (активная и пассивная) межу участниками общения при решении отд подзадач). 3.локальный уровень (рассматриваются отдельные шаги диалога, образуемые взаимосвязанными высказываниями его участников). Шаг диалога – пара «действие-реакция», где высказывание активного участника – действие, а пассивного – реакция. Перехват инициативы возникает когда пассивный участник вместо преследования цели, предложенной активным уч, предлагает преследовать иные цели. Т.о. происходит разрыв первоначально инициированного шага диалога и открывается поддиалог (происходит смена цели (темы) диалога). Основные функции диалогового компонента, структура диалога Роли участников неизменны, однозначны и предопределены – жесткая структура диалога. В простейшем случае такая структура сводится к двум взаимосвязанным высказываниям участников («вопрос-ответ») с указанием участника, владеющего инициативой. Альтернативная структура – задает мн-во возможных направлений течения диалога. Выбор одного из возможных направлений осщ пассивный участник. Гибкая структура – роли участников общения распределяются в ходе общения. Такие структуры подразделяются по степеням свободы выбора момента перехвата (предопределенные моменты, произвольные) и по степени свободы способа перехвата (предопределенный, произвольный).
Продукционные модели, сравнение продукций Level5 Object и G2 Продукционная модель – модель, основ на правилах, позвол представлять знания в виде предложений типа: «если… (условие), то… (действие)», где условие – образец для поиска в базе, действие – действия или операторы, вып при успешном исходе поиска. Система продукций Поста задается своим алфавитом С={с1, …, cn} и системой базисных продукций xiW→Wyi, где xi, yi – слова в алфавите С. пусть нек слово Y начин словом xi. Применить к Y продукцию xiW→Wyi – это вычеркнуть из Y нач отрезок xi и затем к оставшемуся слову приписать слово yi. Например, применив к слову aba продукцию abW→Wc, получим слово ac. Каждая сист-ма продукций понимается как формальная сист-ма с правилами вывода pi, где pi(F,Y) считается истинным (применимым), если слово Y получается из F при помощи продукции xiW→Wyi. Продукционные модели, сравнение продукций Level5 Object и G2 Формальная продукционная система:PS=<R,B,I>, где R – раб память сист-мы (БД), содерж текущие данные; B – БЗ, содерж мн-во продукций (правил вида: «условие→действие»); I – интерпретатор (решатель), реализ процесс вывода. I=<V,S,K,W>, где V – процесс выбора из B и из R подмн-ва активных продукций Bv и подмн-ва активных данных Rv соответственно, котор будут исп в очередном цикле работы интерпретатора; S – процесс сопоставления, определяющий мн-во означиваний, т.е. мн-во пар вида: правило (pi) – данные (di), где piÎPv, {di}ÌRv; К – процесс разрешения конфликтов, определ, какое из означиваний будет вып; W – процесс выполнения выбранного правила. Система Level 5 Object представл собой современное инструм ср-во (ИС) для поддержки разработки и сопровождения СОЗ. Ср-ва Level 5 Object позвол выводить непротиворечивые, обоснованные рекомендации на основе исх ситуации и БЗ о проблемной обл. Продукционные модели, сравнение продукций Level5 Object и G2 Level 5 Object содержит интегрированный набор таких мощных ср-в автоматизации построения СОЗ как: - объекты, обеспечивающие эффективное ОО программир; - комплексные логич возможности, включая правила, демоны, управление целевыми атрибутами, процедурные и непроцедурные модули; - редакторы разработки графич интерфейса пользователя; - доступ к БД и внеш программам, арх клиент-сервер с богатыми возможностями; - полный набор интегрир ср-в отладки, включая пошаговое вып, контрольные точки, трассировку и объяснение. Система Level 5 Object успешно примен для создания приложений в статич проблемных областях. Система G2 – инструментальный комплекс для создания СОЗ (ЭС) реального времени. Класс задач, для кот предназн G2: мониторинг в реальном масштабе вр; системы управления верхнего уровня; системы обнар неисправностей; диагностика; составление расписаний; планирование; оптимизация; системы-советчики оператора; системы проектирования. G2 – это динамич сист-ма; - ОО интегрир среда для разработки и сопровождения приложений реального времени, использующих БЗ.   Продукционные модели, сравнение продукций Level5 Object и G2 Главным недостатком традиционно используемого в статических СОЗ прямого и обрат вывода явл непредсказуемость затрат времени на их выполнение. Традиционные статические ЭС не способны решать те задачи, котор подсилу ЭС реального времени (ЭС РВ), т.к. они не вып требования, предъявляемые к ЭС РВ: представлять измен во вр данные, поступ от внеш источников, обеспечивать хранение и анализ изменяющихся данных; вып одновр временные рассуждения о нескольких различ асинхронных процесса (задачах); обеспечивать механизм рассуждения при ограниченных ресурсах; предсказуемость поведения системы (гарантия того, что каждая задача будет запущена и завершена в строгом соотв с временными огранич); моделировать окр мир, рассм в данном приложении; протоколировать свои действия и действия персонала; обеспечивать восстановление после сбоя; наполнение БЗ для приложений реальной степени сложности с мин затратами времени и труда; настройка системы на решаемые задачи; создание и поддержка пользовательских интерфейсов для различ категорий пользователей; обеспечение уровня защиты инф и предотвращение несанкционированного доступа.   Знания о языке, основные понятия. Классификация зн о языке:1. Лексическре зн (слова, способы их измен и образования); снтаксич зн (правила постр грамматич правил текста); семантич зн (соотн слов и яз констр с объектами и понятиями ПО). 2. Словарь (совок индивид знаний); грамматика (совок категориальных зн). 3. Информац компонента (словарь); операц компон (ср-ва реализ моделей, подмоделей). Архитектура статических и динамических СОЗ (ЭС). Основные принципы: 1.мощность СОЗ обусл мощностью БЗ и возможностью ее пополнения и модификации + используемыми методами и процедурами; 2.зн явл эвристическимим, неопределенными, правдоподобными (те решаемые задачи явл неформализованными); 3.пользователь должен иметь возможность непоср взаимодействия с СОЗ и получения объяснений от СОЗ по ходу рассуждений при решении конкретной задачи. Структура традиционной статич СОЗ: решатель, рабочая память, БЗ, компонент приобретения знаний, объяснительный компонент, диалоговый компонент (средства общения). В статич СОЗ не учит изменения окр мира, происход во время процесса решения задачи (вх данные не измен во время работы СОЗ, значения др данных изменяются только СОЗ). Структура динамич СОЗ (учит динамика, те изменения во время работы СОЗ): структура статич СОЗ + подсистема моделирования внеш мира + подсистема связи с внеш окружением (осущ связь с внеш миром через сист датчиков и контроллеров) + подвергаются изменениям БЗ и решатель. Лингвистическая модель входного подъязыка. Лингвистическая модель входного подъязыка:Lm = <V,G,S>, где V – лексич компон, опред лексику вх подъязыка; G – синтаксич компон, опред порождение правильных конструкций этого языка; S – семантич компон, опред способ записи нек смысл структуры. Mm = <Lm, Pm>, где Pm – понятийная структура.
Методы создания G2 приложений Два способа создания G2-приложения: 1.разраб одномодульное приложение, котор затем при необх разбивается на отд модули. 2.приложение изначально создается как состоящее из неск модулей. Некоторые из них разрабатываются впервые, а др могут выбираться из библиотеки знаний. Модули. Модули приложения организованы в древовидную иерархию с одним модулем верхнего уровня. Модули след уровня состоят из модулей, без которых не может работать модуль предыдущего уровня. Структурирование приложения на модули обесп след преимущества: - позвол разраб приложение одновр неск группам разработчиков; - упрощает разработку, отладку и тестирование; - позвол изменить модули независ друг от друга; - упрощает повторное исп знаний. Модель управления (МУ), задание МУ в словаре Синт комп модели упр (МУ): МУ – особая зона словарной статьи, в котор помещена синтаксич и семантич инф о конкрет лексемме. Число и содержание мест МУ завис от: - числа и хар-ра актантов ситуации, обознач данным словом (семантич валентность слова); - числа и хар-ра дополнений, завис от данного слова и реально наблюд в тексте (синтаксич валентность слова). МУ = семантич валентность слова + синтаксич валентность слова. МУ: индивидуальная, групповая, ядерная. Актанты ситуации – опред лексико-графич анализом ситуации: Агент (А) – одуш возбудитель действия; контрагент (К) – сила, против котор направл действие; объект (О) – вещь, котор явл объектом действия; адресат (D) – лицо, в пользу или во вред котор соверш действия; инструмент (I) – неодуш предмет/сила составл причину действия/состояния; результат (R) – вещь, котор возник в р-те действия. Словарь –совок индивид знаний. Модель управления (МУ), задание МУ в словаре Словарная статья:
     
     
год Сущ, люб, м, неодуш время
Железнодорож. прил Характер. Трансп ср-ва
перевез Гл,..,.., люб актив Модель управл

1 – заглавная зона; 2 – морфологич зона; 3 – синтактико-семантич зона; 4 – основа словаря; 5 – часть речи, число, род; 6 – лексич ф-ции, семантич признаки, категории, классы.

Цикл работы механизма вывода (интерпретатора) в СОЗ (ЭС) Интерпретатор (мех вывода) – управл механизм СОЗ. Его задача – на основании текущего сост раб памяти опред, какой модуль и какими данными будет работать. (схему см на обороте) По окончании работы тек модуля (правила) мех вывода проверяет условия окончания задачи, и если они не удовл, то вып очередной цикл. Каждый модуль снабжается образцом, т.е. описанием, указывающим, при вып каких условий этот модуль может приступить к работе. В общем случае работа мех вывода в каждом цикле состоит из 4-х этапов: выборки, сопоставления, разрешения конфл, выполнения. Каждый из этапов исп в работе след источники знаний: раб память, БЗ, память состояний. Инф о поведении мех вывода запом в памяти состояний. 1.Этап выборки –определений подмн-ва эл-тов раб памяти и подмн-ва правил БЗ, котор могут быть исп в тек цикле. Цикл работы механизма вывода (интерпретатора) в СОЗ (ЭС) Исп один из двух подходов: синтаксич выборка – грубый отбор знаний, данных, правил, котор м.б. полезны в тек цикле (основание для выборки – формальные зн, встроенные в сист-му разработчиком); семантич выборка – отбор зн на осн таки свед, как модель предмет обл, разбиение задачи на подзадачи, тек цели и тд. Семант зн ввод в сист экспертом в виде метаправил. В результ работы этапа происх выделение активного набора данных и активного набора правил. 2.Этап сопоставления – опред, какие активные модули и на каких актив данных готовы к работе. Модуль готов к раб, если среди актив данных есть данные, удовл услов этого модуля, указ в его образе – означенный модуль. Рез работы этапа – набор означенных модулей – конфл набор. 3.Этап разрешения конфл – механизм вывода вбир из конфл набора те означивания, котор будут вып в тек цикле. Интерпретатор оценивает означенные модули с тз их полезности при достижении тек цели. 4.Этап выполнения – осущ исполнение правил (модулей), выбранных на этапе 3. В ходе этапа осущ модификация раб памяти, вып операции ввода/вывода и измен память состояний интерпретатора. Лингвистические аспекты ИДС: понятие языка, подъязыка, треугольника Фрэге. Рассм язык как ср-во общения и язык с т.з. его структуры. Язык – наход в распоряжении того/иного коллектива система элементов-единиц разных ярусов (слов, значимых частей слов и тд) + сист правил функционирования этих единиц. Система единиц – инвентарь языка, система правил функционирования языка (правил генерации и понимания выск) – грамматика языка в широком смысле. Св-ва (подъязыка): 1. Относительная полнота: если подъязык, обусл конкрет ПО, облад дост набором языковых ср-в для отбраж любого факта, то он относительно полон. 2. Замкнутость: если при добавлении к выборке текста подъязыка др текстов подъязыка не происх пополнения словаря, то такой подъязык облад св-вом замкнутости. 3. Конечность: если подъяз имеет конечный/огранич словарь. То он облад св-вом конечности. 4. Формальная ограниченность: если в подъязыке ограничен набор языковых ср-в из общеязыкового арсенала, то он облад св-вом форм огр. 5. Устойчивость: если для понимания текста вх подъязыка не сущ поверхностных синт различий фраз с тождеств смыслом, то он облад св-вом устойчивости (напр, ветер колышет траву/трава колышется ветром). Лингвистические аспекты ИДС: понятие языка, подъязыка, треугольника Фрэге. Уровни изучения языка:1. Дискурс (в сист поним слитной речи и обраб текстов). 2. Уровень предложения. 3. Уровень словосочетаний. 4. Слово. 5. Морфизмы – значащая/незначащая часть слова (приставки). Семиотика вкл неск разделов: синтактика – изуч структурные аспекты сочетаний знаков данной сист, правила их образования и преобразования (безотносительно к их ф-циям и значениям); семантика – рассм знаковые системы как ср-ва выражения смысла, т.е. занимается установл завис между структ знакосочетаний и их выразительными возможностями, изуч сочетания знаков. образ осмысл тексты; прагматика – изуч отнош воспринимающего знаковую сист к самой знаковой сист.
Лингвистические аспекты ИДС: понятие языка, подъязыка, треугольника Фрэге.   Треугольник Фрэге.
 
 

 

 


S – обознач знак – характериз с одной стороны обознач им предметом D (денатат, референт), а с др стороны св-ми этого денатата C (концепт/десигнат, смысл). D – то, что чел наблюд в реальной жизни; C – набор св-в, присущих только рассм предмету.

S – обознач знак – характериз с одной стороны обознач им предметом D (денатат, референт), а с др стороны св-ми этого денатата C (концепт/десигнат, смысл). D – то, что чел наблюд в реальной жизни; C – набор св-в, присущих только рассм предмету.

 

Лингвистические аспекты ИДС: понятие языка, подъязыка, треугольника Фрэге. Омонимия:знак S назыв омонимом, если ему соотв разные концепты C (коса, замок, ядро, стекло). Синонимия: один и тотже денатат D имеет разные знаки (вода – H2O). Пресуппозиция: наличие в неречевых условиях некоторого речевого акта, связ с произнесением текста. Анафирические ссылки: использование указательных местоимений (возьми эту книгу), пропуски текста. Знаковая система м.б. представл в виде Z=<SUKI>, где S – мн-во знаков данной сист; U – универсум, т.е. мн-во всех денататов языка; K – сист знаний, т.е. мн-во понятий, в котор опис концепты и их взаимоотнош; I – мн-во интерпретаций, соотнос знаку либо его денатат, либо его концепт. Характеристика базовых функциональных возможностей системы G2 Основное предназначение – помочь предприятиям сохранять и исп знания и опыт их наиб талантливых специалистов в интел системе реального времени. Класс задач, для кот предназн G2: мониторинг в реальном масштабе вр; системы управления верхнего уровня; системы обнар неисправностей; диагностика; составление расписаний; планирование; оптимизация; системы-советчики оператора; системы проектирования. Основн достоинство оболочки ЭС G2 – возможность применять ее как интегрирующий компонент, позвол за счет открытости интерфейсов и поддержки широкого спектра вычислит платформ легко объединить уже сущ, разрозненные ср-ва автоматизации. G2 – это динамич сист-ма; - ОО интегрир среда для разработки и сопровождения приложений реального времени, использующих БЗ. Создание новых классов не только в процессе разраб, но и динамически, во вр работы приложения. Экземпляры классов имеют графич форму представления + G2 предоставл синтаксические конструкции, позвол осущ рассуждения на основе графич схем. Характеристика базовых функциональных возможностей системы G2 Требования, предъявляемые к ЭС РВ: представлять измен во вр данные, поступ от внеш источников, обеспечивать хранение и анализ изменяющихся данных; вып одновр временные рассуждения о нескольких различ асинхронных процесса (задачах); обеспечивать механизм рассуждения при ограниченных ресурсах; предсказуемость поведения системы (гарантия того, что каждая задача будет запущена и завершена в строгом соотв с временными огранич); моделировать окр мир, рассм в данном приложении; протоколировать свои действия и действия персонала; обеспечивать восстановление после сбоя; наполнение БЗ для приложений реальной степени сложности с мин затратами времени и труда; настройка системы на решаемые задачи; создание и поддержка пользовательских интерфейсов для различ категорий пользователей; обеспечение уровня защиты инф и предотвращение несанкционированного доступа. Представление лингвистических знаний (основные понятия и определения) Способы задания декларативных синтаксич знаний: 1. Синтаксич отнош (предикативные отнош – между сказ и подлеж; копплективные отнош – их 6 шт, отнош между сказ и его дополнением; обстоятельственные отношения – между сказ и обстоятельством; определительные – подлеж-опред; количественные; отрицательные; вспомогательные). 2. Синт комп модели упр (МУ): МУ – особая зона словарной статьи, в котор помещена синтаксич и семантич инф о конкрет лексемме. Число и содержание мест МУ завис от: - числа и хар-ра актантов ситуации, обознач данным словом (семантич валентность слова); - числа и хар-ра дополнений, завис от данного слова и реально наблюд в тексте (синтаксич валентность слова). МУ = семантич валентность слова + синтаксич валентность слова. МУ: индивидуальная, групповая, ядерная. Актанты ситуации – опред лексико-графич анализом ситуации. Пр см на обороте. Агент (А) – одуш возбудитель действия; контрагент (К) – сила, против котор направл действие; объект (О) – вещь, котор явл объектом действия; адресат (D) – лицо, в пользу или во вред котор соверш действия; инструмент (I) – неодуш предмет/сила составл причину действия/состояния; результат (R) – вещь, котор возник в р-те действия.

Представление лингвистических знаний (основные понятия и определения)

Предложение рус языка с тз семант структуры: П = Р(А1…А6) + R, где Р – предикатно-актантная структура, R – распространитель, не влияет на понимание ситуации. Глаголы, краткие прилаг, отглагольные сущ, дееприч, причастия – облад св-ми предикативности. Числительные, наречия, союзы, частицы, знаки препинания – не облад. Кроме семант валентности задаются еще способы их выражения. Примеры глубинных падежей (семантич вал): колотить – 4-х валентный предикат. A, B, C, D – актанты.

  А(агент) В(адресат/тема) С(инструмент) D(поражаемая часть объекта)
  Кто колотит? Sим Sин (кого колотят?), *, ** Sтв По, Sдат
  одуш Одуш, *, ** Физич объект Часть тела объкта В.+

1 – синт комп, 2 – семант комп. Sим – сущность в им падеже. 1* - предлог ПО, треб после себя сущ в дат падеже (ПО, Sдат), 2* - неодуш. 1** - в, Sвинит (колотить в дверь), 2** - преграда. 2+ - Иван колотит Петра кулаком по спине.

3. Лексические ф-ции – инф о лексич сочетаемости отд словоформ. Например синонимия: syn(красивый)=(симпотичный); конверсия: conv(пугать)=(бояться); дереваты: der(вышивать)=(вышивка).

Языки представления знаний в СОЗ (ЭС) (основанные на продукциях и фреймах). Продукционная модель – модель, основ на правилах, позвол представлять знания в виде предложений типа: «если… (условие), то… (действие)», где условие – образец для поиска в базе, действие – действия или операторы, вып при успешном исходе поиска. Формальное описание продукционной системы (нотация BNF): <правило>::= (если <условие> то <действие> иначе <действие>); <условие>::= (и {<предложение>}); <предложение>::= (или {<предложение>}) | (<предикат> <тройка>); <тройка>::= (<объект> <атрибут> <значение>); <действие>::= {<значение> | <процедура>}; <значение>::= (<тройка> <коэф опред>). Фрейм – абстрактный образ или ситуация, для отобр кот исп представление в виде сети, «верхние уровни» кот зафиксированы и представляют сущности, всегда истинные в ситуации, описываемой данным фреймом, а «нижние уровни» заканчиваются слотами, заполняемыми конкретной информацией при вызове фрейма.
Языки представления знаний в СОЗ (ЭС) (основанные на продукциях и фреймах). Нотация FRL:<фрейм>::= (<имя фрейма> {<слот>}); <фрейм>::= (<имя фрейма> <тело фрейма>); <тело фрейма>::= {<слот>}; <слот>::= (<имя слота> (<тип слота> <тело слота>)); <тело слота>::= {<данные>}; <данные>::= <накопитель данных>{<комментарии>}; <комментарии>::= <места>{<сообщение>}; <сообщение>::= <литерал>; <имя фрема>::= <идентификатор>; <имя слота>::= <идентификатор>; <тип слота>::= <идентификатор>; <метка>::= <идентификатор>; <накопитель данных>::= <конкретоне данное> | <имя фрейма> | {<вызов процелуры>}; <конкретоне данное>::= <число> | <текст>; <тип слота>::= <декларативный> | <наследование> | <процедурный>; <декларативный>::= <value> | <default>; <наследование>::= <AKO> | <instance>; <процедуральный>::= <require> | <if needed> | <if added> | <if removed> | <prefer>. Типовая структура ЕЯ-процессора Арх компон понимания вх языка (ЕЯ-сист):текст® морфологич анализ вх текста (V, j*)® синт ан (G, j*)® семантич ан (S, j*)® семантич интерпр (j**)® прагматич интерпр (j***). синтактика – изуч структурные аспекты сочетаний знаков данной сист, правила их образования и преобразования (безотносительно к их ф-циям и значениям); семантика – рассм знаковые системы как ср-ва выражения смысла, т.е. занимается установл завис между структ знакосочетаний и их выразительными возможностями, изуч сочетания знаков. образ осмысл тексты; Под пониманием (обработкой) текстов вх языка понимается построение трех отображений: 1. - перевод нек факта окр мира (j*), - анализ вх текста. 2. - семантич интерпр (j**), - трансформация «очищенного» логико-смыслового gj на язык предст знаний. 3. - прагматическая интерпретация (j***); (RiÎR), где R – мн-во команд вызова. Типовая структура ЕЯ-процессора Лингвистическая модель входного подъязыка:Lm = <V,G,S>, где V – лексич компон, опред лексику вх подъязыка; G – синтаксич компон, опред порождение правильных конструкций этого языка; S – семантич компон, опред способ записи нек смысл структуры. Инструментальный комплекс для создания СОЗ (ЭС) реального времени на примере системы G2 Основное предназначение – помочь предприятиям сохранять и исп знания и опыт их наиб талантливых специалистов в интел системе реального времени. Класс задач, для кот предназн G2: мониторинг в реальном масштабе вр; системы управления верхнего уровня; системы обнар неисправностей; диагностика; составление расписаний; планирование; оптимизация; системы-советчики оператора; системы проектирования. Основн достоинство оболочки ЭС G2 – возможность применять ее как интегрирующий компонент, позвол за счет открытости интерфейсов и поддержки широкого спектра вычислит платформ легко объединить уже сущ, разрозненные ср-ва автоматизации. G2 – это динамич сист-ма; - ОО интегрир среда для разработки и сопровождения приложений реального времени, использующих БЗ. Знания о языке (основные понятия) Классификация зн о языке:1. Лексическре зн (слова, способы их измен и образования); снтаксич зн (правила постр грамматич правил текста); семантич зн (соотн слов и яз констр с объектами и понятиями ПО). 2. Словарь (совок индивид знаний); грамматика (совок категориальных зн). 3. Информац компонента (словарь); операц компон (ср-ва реализ моделей, подмоделей). Психологический, лингвистический и гносеологический аспекты извлечения знаний. См. 46.1. Психологич аспект – в его рамках рассм три слоя псих проблем, возник при извлечении знаний: контактный (эксперт – инж по зн), процедурный (окружение), когнитивный (набор псих приемов). Лингвистич – рассм слои важных для инженерии знаний проблем (проблема «общего кода», понятийная структура, словарь пользователя). Гносеологич– рассм отдельные закономерности процессов отражения действительности в сознании чел (описание и обобщение фактов, установление связей, построение модели, объяснение и предсказание явлений). Морфологический анализ текста. МА – обработка словоформы вне связи с контекстом. Ф-ция МА – идентификация словоформы и приписывание ей комплекса морф инф-ции, служащей в дальнейшем вход инф для след этапа синтаксич анализа. Общий алгоритм МА при процедурном способе представления знаний: 1. Поиск в словаре готовых форм (словоформ). 2. Выделение основы в каждой вх словоформе (отсечение производ слева направо). 3. Поиск основы в словаре основ. 4. Обработка словосочетаний.
Общая характеристика машины вывода, планировщика и подсистемы моделирования G2. Маш вывода вып рассуждения на основании: знаний, содерж в БЗ; данных, поступ от подсист-мы имитационного моделирования; данных, поступ от внеш источников. Правила возбужд машиной вывода. При этом проверяется истинность условия рассматриваемого правила. Если условия правила истинны, то сист-ма выполняет действия, наход в консеквенте данного правила (присвоение значения простому атриб, парам или переменной; посылка управляющей инф внеш объекту; запуск процедуры; создание экземпляра объекта и тд). 9 способов возбуждения правил:1.данные, вход в условие правила, изменились; 2.правило определяет значение переменной, котор требуется другому правилу или процедуре; 3.возбуждается каждые n секунд (механизм запуска процедур-демонов); 4.явное/неявное возбуждение другим правилом; 5.переменной, входящей в условие правила, присвоено значение независимо от того, изменилось оно или нет; 6.возбужд каждый раз при запуске приложения; 7. Определенный объект на экране перемещен пользователем или другим правилом; 8.определенное отношение между объектами установлено или уничтожено; 9.переменная не получила значения в результате обращения к своему источнику данных. Общая характеристика машины вывода, планировщика и подсистемы моделирования G2. Методы 4-9 возбуждают правило при возникновении некоторого события. Для реализации этих методов в G2 введен спец тип правил, начин с ключ слова whenever (как только). Эти правила возбуждаются в первую очередь и облад наиб приоритетом, что гарантирует своевременную реакцию сист-мы на изменения в окр мире. Планировщик необх, т.к. G2-приложение управляет мн-вом одновременно возникающих задач. Планировщик управл всеми процессами в G2. Он контролирует всю активность, видимую пользователем, и активность фоновых задач. Он определяет порядок обработки задач, взаимод с источниками данных и пользователями, запускает процессы и осущ коммуникацию с др процессами в сети. Схема работы планировщика: см на обороте.   Общая характеристика машины вывода, планировщика и подсистемы моделирования G2. Подсист моделирования внеш окружения – явл одним из возм источников данных для G2; - исп для моделирования реальных объектов и устройств, с которыми работает ЭС. Основные возможности: 1.ср-вадля вычисления алгебраических, разностных и диф (1пор-ка) уравнений. 2.возможность задания формул как для отдельных переменных, так и для классов переменных или параметров. 3.возможность режима разделения времени, при котор


Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-08-20 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: