Примеры для самостоятельного решения.




 

5.1. Проверить эквивалентность бинарного отношения “синонимия”.

5.2. Проверить эквивалентность бинарного отношения “синтаксическая однородность”.

5.3. Проверить эквивалентность бинарного отношения “рифма”.

5.4. Исследовать свойства бинарного отношения “изафет (поссесивно-атрибутивная конструкция)” для персидского языка, где маркировано вершинное слово: A Ez. B.

5.5. Исследовать свойства бинарного отношения “конверсивность”.

5.6. Исследовать свойства бинарного отношения “являться праформой слова”.

5.7. Исследовать свойства бинарного отношения “конкатенация” для языка, допускающего образование без интерфиксов сложных слов, состоящих из нескольких корней, иногда совпадающих друг с другом.

5.8. Исследовать свойства бинарного отношения “быть собеседником” для пьесы, в которой все персонажи встречаются в одной из сцен, а монологи отсутствуют.

5.9. Среди 28 основных графем арабского письма существует 6 графем, не соединяющихся с последующей графемой. Исследовать свойства бинарного отношения “соединение с соседней графемой” для арабского письма.

5.10. Исследовать бинарное отношение сочетаемости букв русского языка с, н, д.

5.11. Определить, сколько разделов потребуется для составления трёхъязычного словаря, в котором бинарное отношение “перевод” на множестве языков было бы симметричным и транзитивным.

5.12. Придумать фразу на русском языке, отвечающую B-структуре “пятичленного разбиения”: Pr A S Z V Pr A S.

5.13. Придумать фразу на английском языке, отвечающую B-структуре “пятичленного разбиения”: Z S Z V Pr.

5.14. Придумать B-структуру “пятичленного разбиения” шестисловной фразы на арабском языке, зная, что порядок слов – VSO, а определение стоит после определяемого.

5.15. Дополнить “пятичленное разбиение” на части речи до “десятичленного” и придумать фразу на русском языке, содержащую все элементы нового разбиения.

5.16. Определить разбиение слов по места ударения, взяв в качестве элемента B-структуры номер ударного слога, и привести пример, отвечающий B-структуре 33143.

5.17. Определить разбиение слов русского языка по их этимологии, выделив три класса (исконно славянские слова, заимствования из западных языков и заимствования из восточных языков) и придумать фразу, содержащую не менее двух элементов из каждого из этих классов.

5.18. Придумать примеры из S -структуры фразы: “Студенты сбежали с занятия, не предупредив преподавателя”.

5.19. Придумать примеры из S -структуры фразы: “Даша отсела от назойливого пассажира, заглядывающего в её книгу”.

5.20. Придумать строфу, эквивалентную по метрике каждой строки и схеме рифмовки:

 

“Старый Город окутала тьма,

Огоньки осветили дома,

По ступенькам отвесной скалы

Вверх крадутся два смелых кота”.

 

5.21. Придумать на любом языке строфу, эквивалентную по числу строк и слогов в каждой из них японскому хайку:

 

“Kanashisa ya

Tsuri no ito fuku

Aki no kaze”.

 

 

Метрика.

Для любых элементов x и y множества A можно ввести неотрицательную функцию d(x, y), называемую метрикой и обладающую следующими свойствами:

для d(x, y) = 0 тогда и только тогда, когда x = y (“аксиома тождества”),

для d(x, y) = d(y, x) (“аксиома симметрии”),

для d(x, z) ≤ d(x, y) + d(y, z) (“аксиома треугольника”).

Для вычисления расстояния между словами (как множествами букв) используются три метрики: Хемминга, Левенштейна и Дамерау – Левенштейна. Расстояние Хемминга d H определяется как число несовпадающих компонентов любых объектов одинаковой размерности. Расстояние Левенштейна d L определяется как число несовпадающих компонентов любых объектов произвольной размерности. Расстояние Дамерау – Левенштейна d DL определяется как число несовпадающих компонентов любых объектов произвольной размерности, допускающих перестановку.

 

Во всех приведённых выше определениях под компонентами имеются в виду буквы, а размерность означает длину слова. Расстояние Хемминга позволяет заменять одни буквы на другие для слов одинаковой длины. Расстояние Левенштейна позволяет не только заменять буквы, но и вставлять или исключать буквы. Расстояние Дамерау-Левенштейна позволяет, помимо перечисленных выше операций, менять буквы местами, хорошо описывая метатезу, а также ошибки при описках и опечатках. Для слов одинаковой длины все эти расстояния совпадают. Если расстояния между словами невелики, они могут быть родственными, хотя даже при нулевом расстоянии слова иногда оказываются омонимами!

 

Для вычисления синхронического генетического расстояния между родственными языками можно предложить следующую метрику. Введём обозначения: F – языковая семья, G – языковая группа, SG – языковая подгруппа. Тогда генетическое расстояние d G между языками A и B можно определить так:

 

 

Это расстояние названо синхроническим, так как генеалогическое древо языков может изменяться со временем. Кроме того, один язык может породить целую группу, включающую подгруппы. Поэтому генетическое расстояние имеет смысл для испанского и каталанского языков, но не для испанского языка и латыни.

В случае неясного статуса языка внутри одного из генетических образований расстояние считается максимальным. Например, авестийский язык, принадлежа к иранской группе, не включается ни в одну из двух её подгрупп – западную или восточную. Поэтому расстояние от авестийского до любого древнеиранского языка будем считать равным 2.

Для языков из макросемей расстояние будет больше 3, а для сторонников теории моногенеза генетическое расстояние может достигать больших, но конечных значений. Генетическое расстояние можно ввести и для диалектов, сдвинув на 1 всю “шкалу”: расстояние между разными диалектами будет равно 1, между разными языками одной подгруппы – 2 и т.д.

 

Кроме того, между языками можно ввести и функциональное расстояние d F. Если один язык оказывает на другой язык значительно влияние, выражающееся в лексическом, грамматическом или социолингвистическом аспектах, то будем считать, что между этими языками существует функциональная связь. Эта связь может быть как односторонней, так и двухсторонней. Наличие функциональной связи обозначим чёрточкой: например, “узбекский язык – русский язык”. Для всех языков мира можно составить функциональный граф, вершинами которого являются языки, а рёбра соответствуют функциональным связям. Тогда функциональное расстояние между языками можно определить как длину минимального пути в функциональном графе. Если же такого пути не существует, то будем считать, что d F не определено. А между одинаковыми языками будем полагать d F равным 0. Помимо функционального расстояния, можно ввести понятие функциональной степени языка m F – числа ребёр, инцидентных языковой вершине. Связи между языками меняются, поэтому со временем d F и m F могут изменяться. Во всех примерах по умолчанию имеются в виду функциональные связи, действующие в настоящее время.

 

 

Пример 1. Найти расстояния Хемминга, Левенштейна и Дамерау-Левенштейна между словами frahang (“культура”, среднеперсидский) и farhang (“культура; словарь”, совр. персидский).

 

У этих слов не совпадают только вторая и третья буквы. Для вычисления расстояний Хемминга и Левенштейна требуется две операции замены: a → r, r → a. А расстояние Дамерау-Левенштейна базируется на одной замене: a ↔ r.

Поэтому получается: d H (frahang, farhang) = d L (frahang, farhang) = 2, d DL (frahang, farhang) = 1.

 

Пример 2. Пользователь в спешке набрал сообщение: “Сгодняпрйти не супею, лавай совзонимся звтра”. Найти расстояния Левенштейна и Дамерау-Левенштейна и от набранного им текста до его правильной версии.

 

В первом, втором и последнем словах пропущена одна буква, между первыми двумя словами отсутствует пробел, в пятом слове одна буква написана неверно: оба расстояния равны 4. В четвёртом и предпоследнем словах буквы один раз поменяны местами, каждая замена местами равна 1 для d DL и 2 для d L (например, супею упею успею). Поэтому d DL = 7, d L = 9.

 

Пример 3. Найти генетическое расстояние между латышским и непальским языком.

 

Латышский язык относится к балтийской группе языков, а непальский – к индоарийской группе языков. Обе эти группы относятся к индоевропейской семье языков. Поэтому d G (латышский язык, непальский язык) = 3.

 

Пример 4. Найти функциональное расстояние между татарским и нивхским языком.

 

Эти языки не оказывают друг на друга никакого влияния, но на оба этих языка значительно влияние оказывает русский язык. Поэтому образуется функциональная цепочка: “татарский язык – русский язык – нивхский язык”. Значит, d F (татарский язык, нивхский язык) = 2.

 

Пример 5. Найти функциональную степень ненецкого языка.

Поскольку на ненецкий язык существенное влияние оказывает только русский язык, m F (ненецкий язык) = 1.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-06-12 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: