Понимание и порождение письменной и устной речи с помощью компьютера.




1. Особенности компьютерных систем в понимании и порождении текста и речи.

2. Компьютерная система понимания связного текста.

3. Порождение связного текста с помощью ПК.

4. Автоматическое распознавание устной речи.

5. Синтез устной речи с помощью ПК.

 

Пока ПК, обладающие возможностью обрабатывать письменные тексты и устную речь, имеют в своей памяти ограниченные конкретной предметной областью базы знаний. Базы знаний – лингвистические и нелингвистические данные, а также правила их обработки. Речемыслительная деятельность человека – очень сложный и до конца не изученный вид деятельности. Сегодня не возможно говорить о его полном моделировании на ПК. Существующие в разных странах экспериментальные и промышленные системы обработки текста и речи созданы с учетом наложения определенных ограничений на их функционирование. Такие системы решают не общие (универсальные), а частные задачи понимания и порождения текста и речи.

Компьютерные системы. Понимание связного текста.

Проблема понимания текста ПК еще находится на стадии изучения. Разные точки зрения на эту проблему, выделяют разные уровни понимания, построены различные системы, способные понимать текст. Наиболее сложные для понимания – тексты, описывающие взаимоотношения и поступки действующих лиц (художественная литература). В этом случае ПК должен хранить большие базы знаний об окружающем мире. Более простые – тексты, содержащие описание фрагментов статического мира. Понимание в таких системах трактуется как извлечение из текста наиболее существенной информации с точки зрения ПК. Полученная в результате понимания информация может пополнить базу знаний системы или может быть передана пользователю. Под передачей понятого пользователю имеют в виду способность ПК отвечать на вопросы пользователя относительно событий, описанных в тексте не в виде отдельных слов или предложений, а в виде связного текста. В общем плане согласно современным теориям автоматического понимания текста ПК понял текст, если он может:

1) Кратко изложить его содержание

2) Ответить на вопросы к этому тексту

3) На основе текста нарисовать картинку или схему (создать).

4) Приведенные в тексте сведения представить в виде таблицы, графика.

5) На основе анализа текста, написанного на одном языке, выдать адекватную информацию на другом языке (перевод и анализ)

6) Сравнить содержание 2 разных текстов и выдать информацию о том, что в них общего и в чем различие

7) Путем анализа 1 или нескольких разных текстов извлечь такие знания, которые можно поместить в некоторую базу знаний

Уровни автоматического понимания письменного текста.

Соотнося уровни понимания текста ПК с основными уровнями языка можно выделить следующие уровни автоматического понимания:

1) Морфологический. Сводится к автоматическому приписыванию каждому слову текста его морфологических характеристик. Наиболее освоенный вид компьютерного понимания текста. В последние годы такие операции легко реализуются в рамках автоматического лексико-грамматического анализа при создании корпусов текста.

2) Синтаксический. Его суть заключается в автоматическом выделении в каждом предложении текста главных и второстепенных членов и установления между ними различных типов связи.

3) Семантический. Автоматически устанавливаются значения выделенных на синтаксическом уровне составляющих предложений. ПК определяет, например, выражено ли подлежащее одушевленным или неодушевленным существительным. Сказуемое выражено глаголом движения или чувствования, определение является согласованным или несогласованным, обстоятельство – причины, места и т. д. Подобные процедуры проводятся с опорой на необходимое окружение.

4) Гиперсинтаксический (прагматический). Выяснение семантических отношений между предложениями текста, выявление соответствующей тексту ситуации реальной действительности.

Типы автоматического понимания.

Компьютерная система. Понимающая письменный текст, должна иметь в своей базе знаний следующую информацию:

1) Знания о языке, на котором написан текст

2) Правила использования знаний о языке

3) Знания о реальном мире (предметной области)

4) Правила использования знаний о фрагменте реального мира

5) Знания о пользователе системы, желающем получить от ПК некоторое понимание письменного текста.

В зависимости от сложности используемых знаний и их количества различают следующие типы автоматического понимания текста:

1) Понимание – узнавание. При этом предполагается, что комп система имеет лишь знания о языке. Суть понимания сводится к тому, что ПК узнает морфологическую структуру каждого слова предложения, проводит синтаксический анализ каждого предложения, узнает в исходном тексте ключевые слова, словосочетания, предложения.

2) Понимание – уподобление. ПК должен иметь знания о языке и правила использования этих знаний. Считается, что система понимает текст, если она может ответить на вопросы по этому тексту. При таком понимании ПК находит готовые ответы в своей базе знаний, ранее занесенные человеком. (Она уподобляется человеку)

3) Понимание – прогнозирование. Эти ПК системы ориентированы на поинмание текстов достаточно узкой предметной области. ПК должен иметь знания о языке, правила их использования и знания о предметной области. Считается, что система понимает текст, если она может определить, какой объект или событие предметной области соответствует отдельным фрагментам этого текста. Но одним и тем же фрагментом текста могут соответствовать различные объекты, события. Поэтому соотносить их можно лишь с определенной степенью вероятности (отсюда термин «прогнозирование»).

4) Понимание – объединение. В базе знаний системы 4 вида знаний:

i. Знания о языке

ii. Правила их использования

iii. Знания о предметной области, представленные некоторыми утверждениями

iv. Правила оперирования этими знаниями (утверждениями)

Объединяя эти виды знаний, ПК сись должна уметь делать выводы, умозаключения по тексту, объяснять, почему она сформулировала тот или иной вывод. Это работа экспертных систем.

5) Объяснение. Система. Используя этот принцип понимания, имеет в своей базе знаний все 5 видов знания, включая знания о целях, профессиональную компетенцию пользователя системы. ПК должен уметь объяснить польз, каким образом он понял текст, верно ли выполнил задания польз, т ксистема должна давать объяснения любому конкретному пользователю с учетом уровня его образования, знаний и опыта. В таких системах – диалог: комп – пользователь.

Сегодня проблема автоматического понимания текста реализована в след комп системах, позволяющих извлекать из текста определенную информацию:

1) Системы автоматического индексирования, аннотирования, реферирования и перевода текста

2) Информационно-поисковые и информационные системы

3) Экспертные системы

3. Системы автоматического порождения письменного текста. Более сложными являются по системы порождения текста. Проблемами порождения с помощью ПК исследователи занимаются с начала 70-х. но до сих пор нет единой теории текстообразования. Не может быть создана единая теория порождения текста. Основная причина: неоднозначное определение понятия «текст». Создатели диалоговых систем (банкомат) под текстом понимают любую реплику, состоящую из нескольких слов или предложений. Создатели систем генерации метеосводок и статотчетов понимают под текстом некоторую таблицу. Для создающих инструкции текст – это цепочка несвязанных между собой предложений, относящихся к одному объекту. Художественные, публицистические, научно-популярные тексты – необходимы законы построения текстов разных стилей и жанров.

 

Этапы порождения текста. Процесс текстообразования состоит из 2 этапов:

1) Стратегический(решение, что писать)

2) Тактический (решение о том, как написать)

Результатом выполнения первого этапа должно стать семантическое (смысловое) представление будущего текста. А второго – сам текст в языковой форме.

Общая структура порождения письменного текста. В общем плане в системе автоматического порождения текста должны быть представлены 3 взаимосвязанных компонента:

1. Оболочка

2. Планировщик

3. Лингвистический реализатор

Оболочка определяет назначение порождающей системы. В ней содержится вся база знаний, кот состоит из 2ух частей:

нелингвистической (предметной), в которую входят понятия, связи и отношения между понятиями конкретной предметной области

лингвистической, которая включает формализованные сведения о конкретном языке, на котором генерируется текст (списки морфем, словарь с лексикой, синтаксические структуры предложений, семантико-синтаксические структуры абзаца и всего текста)

Планировщик выполняет след функции:

определяет ту инфу, кот должна быть представлена в тексте

определяет, как эта информация будет представлена

определяет порядок следования абзацев в тексте, синтаксических составляющих в пределах абзаца и всего текста

осуществляет языковое оформление, взаимосвязи предложений в тексте

осуществляет построение синтаксической структуры предложений будущего текста

выбор соответствующей лексики

Все эти задачи планировщик решает с опорой на базу знаний.

Лингвистическийреализатор обеспечивает грамматическую правильность порождаемого текста и принимает все окончательные синтаксические и морфологические решения.

Виды компьютерных систем порождения текста. Условно делятся на 2 группы:

1. системы, работающие на основе шаблонных технологий. Строят будущий текст, манипулируя готовыми предложениями и словосочетаниями как строительными блоками. Эти системы достаточно просты и надежны, находят широкое промышленное применение (GSM – навигаторы). Содержание порождаемого текста представлено в виде фрагментов текстов, созданных ранее людьми. Они выглядят естественными. Но эти системы работают с очень жесткими типами текстов.

2. Компьютерные системы, работающие на основе лингвистически мотивированных технологий. В этом случае для создания текста системе необходимы знания структуры содержания генерируемого текста. Сложные лингвистические знания, которые позволяют выразить это содержание языковыми средствами. Сказки,анекдоты,рассказы, стихи. Промышленных систем нет, только экспериментальные.

 

 

Распознавание устной речи

Проблемами распознавания устной речи ученые уже занимаются уже более 60 лет. Но до сих пор они в полном объеме они не решены. Под распознаванием речи ПК в полном объеме понимается такое распознавание, которое подобно восприятию речи человеком в любых условиях и при общении с любым человеком.решению этой проблемы мешают следующие факторы:

1) Нет четких теоретических представлений, которые бы описывали весь комплекс преобразований, осуществляемых нервной системой при переработке речевых сигналов.

2) Слитно произнесенная речь обладает следующими свойствами:

1. Границы слов размыты

2. Соседние звуки влияют друг на друга

3. Знаменательные слова произносятся отчетливо, а функциональные слова могут проглатываться/отсутствовать

3) В голосе говорящего человека всегда есть экстралингвистическая информация, свидетельствующая о его особом эмоциональном состоянии, указывающая на его пол. Возраст, национальность, состояние здоровья.

4) В процессе речевого общения большое значение имеют паралингвистические средства коммуникации:

1. Панация. Характеристики голоса чел

2. Кинесика. Мимика, жесты.

3. Проксемика. Расстояние между людьми.

Первые промышленные системы распознавания речи появились в первой пол 50х годов в Японии. Диктографы. Имели узкую специализацию. Лидер – IBM. «Viovoice». 140 слов в минуту. На русском не распознает. Русская – «дракон». Dragonsystem.

Алгоритм работы СРР:

1. Ввод устной речи

2. Обработка данных (снимаются шумы)

3. Деление звукового потока на сегменты

4. Выделение в каждом сегменте минимальной акустической единицы (слова).

5. Сравнение выделенной единицы с эталонами

Сегодня АРР может осуществляться только при наложении определенных ограничений на процесс распознавания. Например: распознавание изолированно произнесенных слов, распознавание с предварительной настройкой на голос конкретного пользователя, распознавание речи с опорой на небольшой словарь.

Промышленно реализованные системы:

1. Средства речевого управления(ПК, мобильным телефоном)

2. Средства надиктовки текста

3. Информационно-справочные системы, работающие в диалоговом режиме в качестве автоответчика

4. Средства идентификации человека по образцу речи

 

 

Системы автоматического синтеза речи

Сегодня есть большое число синтезаторов, которые могут озвучить в ПК тексты или произнести фразы, произнесенные ранее и записанные в памяти человека. Первые системы в конце 70х в Японии в метро. Сегодня существую 3 метода автоматического синтеза речи:

1. Кодирование (запись в 2ичной системе) речевых сигналов с их последующим восстановлением. Один из самых элементарных подходов к созданию говорящего ПК. По существу ПК в данном случае используется как магнитофон. Слова и фразы записываются в ПК заранее и в нужный момент воспроизводятся по командам, поступающим из программы. Возможность сказать слово или фразу, которые не были записаны ранее в память, отсутствует. Для хранения речевых сигналов в их непосредственной форме нужна память большого объема. Поэтому он используется, когда необходимы словарь не слишком велик. Полученная таким образом речь по качеству приближается к человеческой.

2. Фонетический синтез речи или акустическое моделирование голосового тракта человека. Синтезатор, построенный в соответствии с этим методом, принципиально отличается от первого и имеет неестественное звучание речи. Синтезатор говорит голосом робота. Поскольку речь создается из отдельно синтезируемых звуков, правильно расставив нужные звуки, ПК может произнести любое слово. Как правило, фонетический синтез речи осуществляется по орфографическому тексту. ПК умеет преобразовать буквы в фонемы, определить словестные и фразовые ударения, интонацию, с которой нужно прочитать каждое предложение. ПК может преобразовать фонемы в аллофоны и синтезировать непрерывный речевой сигнал с использование аллофонов конкретного диктора, выбираемого из базы данных. По мере совершенствования речь синтезатора становится все более разборчивой. Этот метод синтеза речи весьма перспективен, поскольку речь действительно генерируется самим ПК.

3. Математическое моделирование голосового тракта человека. Словарь в синтезаторах этого типа, как и в первом методе синтеза речи, обычно создается с участием говорящего человека. Но в данном случае в память записываются не слова и фразы, а производится выделение числовых характеристик звуков речи и интонации фраз. Такой подход позволяет значительно уменьшить объем необходимой памяти (в ней хранятся только числовые параметры). Это одно из главных достоинств этого метода. Как и в первом методе, синтезируемая речь звучит естественно. Для ее генерации числовые характеристики по специальным командам преобразуются обратно числовые сигналы. Самый перспективный – 2ой метод. В настоящее время специалисты работают над тем, чтобы синтезируемая ПК речь звучало естественно, живо, эмоционально.

 

 

Базы данных и лингвистические информационные ресурсы (ЛИР)

1. Общее понятие о БД, действия над данными. СУБД, основные функции

2. ЛИР, основные понятия, виды.

БД – совокупность определенным образом упорядоченных сведений о некоторых объектах. Объекты – факты, события. Данные, сведения. Могут быть материальными (товар, машина, студент) и нематериальными (процесс, перевод текста, факт – поступление в универ). Каждый объект обладает определенными св-вами, атрибутами (скорость, вес, цвет), которым приписываются определенные значения. В БД атрибуты представляются элементами данных или просто данными. А их значения – значениями данных.

№ зачетки ФИО Год рождения пол группа специализация Стипендия
  Иванов   м   Англ,кит  
  Петрова   ж   Англ, тур  

 

Данные- некоторый показатель, который характеризует данный объект и принимает для конкретного элемента объекта некоторые значения. Чтобы пользователь мог обратиться к записи, ее необходимо идентифицировать. Одно из данных выбирается в качестве идентификатора (ключа).

База данных может быть представлена несколькими файлами. База данных – совокупность данных, относящихся к одному объекту. Представлена чаще всего в реляционном (таблицы) виде.сегодня в базе данных хранится не только текстовая инфа, но и графическая, и звуковая, и видео инфа. Действия, кот можно производить над данными в базе данных:

1) Ввод новой записи в БД

2) Обновление существующих записей

3) Удаление записей

4) Поиск информации

Примеры БД:

«библиотека»

«абитуриент»

«кадры»

Телефонный справочник

СУБД – совокупность программных средств, позволяющих осуществлять создание, введение БД и поиск в них информации. 2 основных типа СУБД:

Настольные. По степени сложности

1. СУБД для обработки небольших объемов информации (MSOutlook - органайзер)

2. СУБД, ориентированные на пользователя, не умеющего программировать (MSExcel)

3. СУБД, ориентированные на разработку приложений (MSAccess, FoxBase)

Сервисные. Используют архитектуру «клиент-сервер». Централизованное хранение и обработка данных. (MS SQL Server)

Основные функции СУБД:

1) Обеспечить создание структуры БД (необходимо определить какая информация будет храниться, какие атрибуты и типы данных)

2) Модификация информации (добавление, удаление, редактирование)

3) Поиск информации

ЛИР – множество определенным образом организованных речевых и языковых данных, находящихся на машинных носителях и используемых в различных сферах практической деятельности (в образовании, пром-ти, культуре, искусстве).

В общем виде ЛИР – своеобразная лингвистическая БД, которую можно обновлять и в которых можно искать ту или иную информацию. ЛИР необходимы как пользователям ПК, так и различным компьютерным системам, связанным с обработкой текста и речи: системы реферирования, синтеза речи и текста, автоматического анализа текста.Пассивные ЛИР делятся:

1) Письменный лексикон. Представлен одноязычными и многоязычными словарями. Многоязычные словари – электронные словари, которые служат для поиска переводных эквивалентов. Лингво, мультитран. Типы одноязычных словарей:

1. Простейшей лингвист базой может служить алфавитно-частотный или частотно-алфавитный словарь словоформ какого-либо текста.

2. Более сложной БД – словоуказатель. Кроме абсолютной частоты употребления словоформы в тексте, номера страниц, строк, где она встретилась.

3. Еще более сложный тип – конкордансы. В них каждое слово текста характеризуется не только численными показателями, но и некоторым контекстом, в котором она употреблена. Как правило, 3 предложения.

4. Словари – энциклопедии. Содержат характеристики не слова как такового, а обозначаемого им предмета, факта или явления.

5. Тезаурус. Указываются семантические связи между определенной частью его лексических единиц. Самый первый в 1852г.

6. Терминологические. Его основная единица – термин.

7. Толковые.

2) Письменные текстовые массивы (корпус текста). Совокупность текстов, являющееся достаточной для обеспечения надежных выводов о некотором языке, диалекте или ином подмножестве языка. Суть создания корпусов текста – достоверные данные о морфологической, фонетической. Синтаксической и семантической структуре языке и речи могут быть получены из достаточно большого массива текста. Могут быть использованы для:

1. Составления различных словарей, выделения терминов. Определения многозначных слов

2. Определения частоты определения грамматических морфем

3. Выявления наиболее употребляемых типов словосочетаний и предложений, частоты употребления классов слов.

4. В лингвистике для дифференцирования типов текста, создание конкордансов

5. При машинном переводе

Стали создавать тегированные корпусы текстов. Слова такого корпуса получают буквенные или цифровые индексы, которые обозначают их грамматические, лексические, семантические структурные признаки. Сегодня часто создаются параллельные тегированные корпусы текстов (на 2 языках).

3) Фонетические ресурсы (корпусы устной речи). Главная трудность создания связана с необходимостью транскрибирования устной речи. Несмотря на трудности в мире существуют много фонетических корпусов, которые широко испольдля:

1. Сопоставительного изучения устной и письменной формы языка

2. Для изучения грамматических и лексических особенностей устной речи

3. Для создания компьютерных систем. Используются с целью распознавания и синтеза устной речи.

Примеры:

В сша корпус устной речи. Кот содержит 225 записей психологических сеансов в 9 городах

В германии записи радиопередач 222 текста

 

Возможности современного ПК и информационные технологии в 3тыс-летии

1. Перспективы развития интернет

2. Виртуальная реальность.

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-07-22 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: