История компьютерной лингвистики на Западе.




Содержание.

 

Содержание. 1

1. Предыстория. 1

2. История компьютерной лингвистики на Западе. 4

2.1. АОТ с 40-х годов XX века по 1965 г. 4

2.2. АОТ с 1966 по 1980 год. 8

2.3. АОТ в 80-е и 90-е годы. 11

2.4. Современные результаты компьютерной лингвистики. 15

3. История компьютерной лингвистики в СССР и России. 16

3.1. До теории «Смысл↔Текст». 16

3.2. Теория «Смысл<->Текст». 17

3.3. 70-е-80-е годы. 21

3.4. Современные коммерческие системы. 23

Использованная литература и другие источники: 24

 

 

Предыстория.

 

Для античности был характерен синкретизм мышления. Человек понимался как часть природы и общества. Человек отождествлялся мышлению, а мышление миру. Мир можно познавать через слова, поэтому речь также отождествлялась с мышлением. Мышление понималось только в словесно-логической форме. Языковое и мыслительное содержание не различались. Центральным понятием античного учения о языке был Логос – то, при помощи чего боги вступают в разговор с людьми. Логос – это и слово, правильно выражающее мысль, и мысль, правильно выраженная в слове. В этом периоде поднимается вопрос о том, что первично для языка – человеческое сознание или внешняя объективная данность. Аристотелем впервые вводится логика для исследования речи и языка, а позднее Квинтилиан вводит разделение искусств на грамматику, логику и риторику.

 

В более позднее время влияние римской империи привело к тому, что в Европе больше чем на тысячу появился общий язык – латынь, а центральной проблемой в учении о языке стал спор реалистов и номиналистов. Реалисты утверждали, что универсальные понятия (человек, лошадь и т.д.) существуют в действительности, независимо и первично по отношению к физической реальности. Номиналисты заявляли, что различные объекты имеют независимое существование. Посредством универсальных понятий в языке помечаются понятия, существующие лишь в сознании, абстрактные понятия.

 

В 1453 году пал Константинополь. Латинская лингвистика ограничилась рамками Италии. Но возродился интерес к работам греческих и римских классиков. Европа была политически разделена. Чтобы иметь возможность управлять, правительства отдельных государств использовали местные языки в качестве общенациональных. Потребность в латыни снизилась.

 

Средневековье вводит понятие грамматики (грамматика Порт-Ройаль), которая подразделяется на морфологию, синтаксис и прагматику. Локк вводит разделение понятий

Концепт (понятие как таковое) и его Выражение. Кондиак выделяет минимальные смысловые единицы речи. Язык описывается как единство структуры и смысла. Для целей книгопечатания вводятся стандарты языка, разработанные Кэкстоном. Изобретение книгопечатания Гуттенбергом решающим образом повлияло на характер изучения языка.

 

Центральной проблемой учения о языке Нового времени стал поиск Истинного Языка. Европейские ученые обратили свое внимание на санскрит, древний язык с сильно развитым словоизменением и более сложный, чем греческий. Гумбольдт выдвигает гипотезу о существовании в древности протоиндоевропейского языка. Дарвинизм дал толчок изучению языков первобытных племен и представлениям о эволюции языка.

 

Основоположником современной лингвистики принято считать Соссюра.Согласно Фердинанду де Соссюру, идеи подобны Вселенной, из которой ничто не может быть выделено в независимое состояние. Ничто не может быть идентифицировано (однозначно определено) до возникновения языка. Знаки (в частности звуки и слова), приписываемые человеком вещам и явлениям изначально произвольны. Для Соссюра то, что может быть извлечено путей изучения прошлого языка, имеет мало практического значения. Более важным для его учения является прояснение структуры языка. Соссюр доказывает, что вопросы, касающиеся отношений языка и мира не являются основой учения о языке.

Языком (la langue) он называл общий для всех говорящих набор средств, используемых при построении фраз; речью (la parole) – конкретные высказывания индивидуальных носителей языка. Лингвистика по Соссюру изучает структуру языка (la langue).

Большинство современных разработок в области АОТ являются продолжением теории Соссюра и основываются на изучении языка, добавляя к нему исследование речи.

 

До Соссюра язык рассматривался как именование природных объектов (Теория Имен). Соссюр предположил, что природа в хаотическом состоянии может быть разделена только когда язык вводит ссылки на ее объекты, так чтобы каждый объект мог быть распознан. Это был поворот на 180 градусов по отношению к общепринятому воззрению. Другими словами, предполагалась автономия языка. Изучение языка превращалось в науку о предмете, независимом от мира природы.

 

Тезис об автономности языка Соссюр развил в понятиях «означающего» и «означаемого». Языковой знак состоит из акустического образа («означающего») и понятия («означаемого») и имеет два основных свойства. Во-первых, между означаемым и означающим нет внутренней, естественной связи – связь произвольна. Во-вторых, означающее обладает протяженностью только в одном измерении (во времени). Означаемое и означающее не устанавливаются извне – они внутренне присущи языку.

 

В то время как Соссюр предлагал противопоставление означаемого и означающего вкупе с произвольностью природы языка, Чарльз Сандерс Пирс изучал человеческие познавательные процессы.

Пирс вводит понятие «интерпретации», чтобы иметь возможность обращаться с языком в конкретном контексте. Были предложены три структуры (абстракция возрастает слева направо):

 

икона индекс символ
абдукция индукция дедукция
термин предположение аргументация
Соссюр исключил понятия этой колонки из своего учения ради идеи независимости языка «означающее» у Соссюра «означаемое» у Соссюра

 

Дедукция (лат. deductio — выведение) — метод мышления, при котором новое положение выводится чисто логическим путем из предшествующих, вывод осуществляется по правилам логики, подразумевает цепь умозаключений (рассуждение), звенья которой (высказывания) связаны отношением логического следования. Началом (посылками) дедукции являются аксиомы, постулаты или просто гипотезы, имеющие характер общих утверждений («общее»), а концом — следствия из посылок, теоремы («частное»). Если посылки дедукции истинны, то истинны и ее следствия. Дедукция — основное средство доказательства. Противоположно индукции.

 

Индукция (лат. inductio — наведение) — процесс логического вывода на основе перехода от частного положения к общему. Индуктивное умозаключение связывает частные предпосылки с заключением не столько через законы логики, а скорее через некоторые фактические, психологические или математические представления.

 

Абдукция - рассуждение, имеющее дело с гипотезами. Гипотезы, относящиеся к реальному миру, получаются согласованием правил и достигнутых результатов. Абдукция в логике — силлогизм (рассуждение, состоящее из трёх простых атрибутивных высказываний: двух посылок и одного заключения), вид редуктивного вывода, с той особенностью, что из посылки, которая является условным высказыванием, и заключения вытекает вторая посылка. Пример: Первая посылка - Все люди смертны. Заключение - Сократ - смертен. Мы можем предположить, с помощью абдукции, что вторая посылка - Сократ - человек.

Язык рассматривается и как способ умозаключения, и как некто, основанное на определенных аксиомах, и как зеркало реального мира.

 

 

История компьютерной лингвистики на Западе.

 

Автоматической обработке текстов на естественном языке (АОТ) достаточно много лет. Использование компьютера для расчетов артиллерийских таблиц и расшифровки шифров уже не казались чем-то очень уж важным через несколько лет после окончания второй мировой войны. Мирное время дало исследователям возможность пофантазировать и на другие темы. Впрочем, до 1960-го года в области АОТ было сделано достаточно небольшое количество работ, так что вполне нетрудно было бы написать их исчерпывающий обзор. Настоящая революция произошла в 60-е годы.

 

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2019-02-10 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: