Создание баз знаний различного типа. Часть 2.
На примере темы «Питание. Приготовление пищи»
Задача 5. Разработка лингвистической базы знаний
1. Представьте в схематическом виде структуру фрагмента учебной базы знаний, которая была создана при выполнении задачи 4. В этой схеме должны быть явно показаны все связи между текстами и словарными статьями, которые были реализованы в виде гиперссылок. Например, схема может иметь следующий общий вид:
На этой схеме вместо обозначений «Текст 1», «Текст 2», «Диалог 1», «Слово 1» и т.д. необходимо вводить загловки соответствующих записей, которые были созданы на сайте rus.lang-study.com. Стрелки означают наличие гиперссылки от одной записи (из которой стрелка выходит) к другой (в которую стрелка входит).
2. Внимательно изучить словарные статьи и тексты. На их основе выписать соответствующие лингвистические знания (только те, которые есть в подготовленных исходных материалах). В частности:
· наименования использованных в созданном словаре частей речи, а также их грамматических характеристик и синтаксических ролей (хотя бы на уровне членов предложения);
· из таблиц «Грамматические формы» выписать соответствующие грамматические характеристики. Например, род (мужской, женский, средний), падеж (…), число (…) и т.п.;
· окончания, соответствующие различным грамматическим формам с указанием значений грамматических характеристик (комплексов морфологической информации, КМИ). Например: -а – сущ., ж.р., ед.ч. и т.д. Замечание: возможно, некоторые окончания будут иметь несколько различных КМИ. Это нормально, и их обязательно необходимо выписать все (но только те, которые имеются в исходных материалах);
· приставки, суффиксы и пр. морфемы с указанием их соотношения к части речи, а также описанием оттенка значения, которое соответствующая морфема добавляет к лексическому значению исходного слова;
· и т.д.
3. Попробовать представить подготовленные при выполнении предыдущего пункта лингвистические знания в виде семантической сети (по желанию). Это декларативные знания.
4. Сформулировать 2-3 высказывания-правила образования словоформ в виде: а) простого высказывания на естественном языке, б) в форме ЕСЛИ … ТО …. При этом использовать ту лингвистическую информацию, которая была перечислена при выполнении предыдущего пункта. Попробовать (по желанию) представить эти правила в виде семантической сети. Это процедурные знания.
5. Аналогично, сформулировать 2-3 высказывания-правила образования новых слов в виде: а) простого высказывания на естественном языке, б) в форме ЕСЛИ … ТО …. При этом использовать ту лингвистическую информацию, которая была перечислена выше. Попробовать (по желанию) представить эти правила в виде семантической сети. Это тоже процедурные знания.
6. Придумать любые другие примеры правил, которые могли бы быть в создаваемой лингвистической базе знаний, и записать их в виде соответствующих высказываний на естественном языке. Попробовать перефразировать их в форме ЕСЛИ … ТО … И это процедурные знания.
Задача 6. Создание базы знаний диалоговой системы
1. Возьмите в качестве примера любой из диалогов, который был подготовлен при выполнении задачи 1.
2. Представьте этот диалог в виде структуры из линейной последовательности реплик. Например:
Это структура диалога.
3. Подумайте, как еще мог бы развиваться диалог. Например, в зависимости от разных ответов на вопросы собеседников, либо в случае разных мнений. Добавьте альтернативные варианты соответствующих реплик в созданную структуру диалога. Например, структура диалога может приобрести следующий вид:
4. Еще раз изучите созданную структуру диалога и найдите в репликах те места, которые могут быть заменены переменными, чтобы из реплик получились шаблоны, при подстановке в которые новых слов (например, наименований других блюд и продуктов) получались бы новые аналогичные диалоги. Опишите соответствующие переменные и проставьте их в репликах. Например: A – название блюда, B1, B2, B3, … - названия продуктов, C1, C2,… - названия посуды, D1, D2 – имена персонажей и т.п. Тогда, например, структура диалога с шаблонами реплик примет примерно следующий вид:
5. В полученной структуре диалога с шаблонами реплик и переменными определите места, где необходимо применение правил словоизменения, словобразования и др. правил (см. задачу 5). Обознаьте эти места следующим образом: вместо словоформы напишите соответствующее слово в начальной форме, а в скобках запишите идентификатор соответствующего правила. Перечислите отдельно идентификаторы правил и расшифруйте их кратко. Например:
P1(X) – согласование имени прилагательного с существительным
P2(X) – согласование глагола с существительным
P3(X, род.п.) – имя существительное в заданной форме
Примечание: В полученной структуре со ссылками на элементы лингвистической базы знаний (так же, как и в приведённых здесь примерах) возможны неточности, т.к. это только несколько упрощенный учебный пример разработки базы знаний диалоговой системы. В реальной практике все неточности и неоднозначности должны быть устранены, но это требует значительных усилий со стороны разработчика.