Количественные методы в стиховедении: исследование рифмы. Количественные параметры рифмы, их эволюция.




Традиционно считалось, что колич. измерения не применимы к худ. лит-ре, особ. к стихам из-за сильного индивид. начала.

Стиховед Жирмунский исслед рифму, стихи, стихотворн. размеры: эволюция идет к наиболее точной рифме, а затем наоборот.

Шепелёва измеряет точность рифмы, степень отклонения по трём параметрам:

1). богатство созвучия – количество элементов, который составляют рифменные созвучия – число пар идентичных и тождественных фонем. Идентичные фонемы – гласные (ударные сами себе, безударные все), идентичные согласные – отличаются одним дифференциальным признаком: б-п.

У рифменного созвучия есть правая и левая границы. Если на левой – согласная, рифма четкая.

Безударные включаются на левой границе, если:

1. хотя бы один из гласных находится в неприкрытом слоге – когда начинается с гласной: она – роняя.

2. безударные гласные находятся в закрытом первом безударном слоге, если они тождественны по звучанию и непосредственно за ними нет разрыва: земля – кремля.

3. в одном из членов рифмующейся пары безударный гласный смещён вправо: гранит – согни.

2). Местоположение созвучия в строке = М = (М левой + М правой) / 2.

если сократилась область созвучия, то психологически рифма воспринимается хуже.

3). Степень отклонения данной рифмы от точной.

Если рифмы тождественны, степень отклонения = 0.

Если чередования идентичной согласных – присваивается один бал. верит - верить

И есть визуальное различие – 1,5. окна - прогнал

Если есть визуальное различие при одинаковом звучании гласного или согласного – 0,5. лук – луг.

Если меняется не идентичный согласный – 3,5.

Если разрыв в одну согласную фонему – 3,5.

Если различия между безударными гласными – 1,5.

Если в созвучие внедряется безударный гласный – 2,5.

Если происходит смена ударного гласного – 4,5. загсе - такси

Если в рифму вклинивается ударный гласный или слог – 5. зыбей – кораблей.

Гаспаров: число опорных звуков – звуки, которые входят в рифм. созвучие и предшествуют ударному гласному (ограда – отрада, р – опорный звук, присваивается 1б.)

 

9. Типологический анализ языков и диалектов количественными методами.

А.Я. Шайкевич решил классифицировать национальные языки: он взял «Словарь синонимов основных ИЕ язов» под ред Бака 1949. В этом словаре языки рассматриваются как родн языки на разных этапах. В основу классификации берет понятия, которые выражаются в любом языке(627 понятий). Считает, что данный признак является общим для сравниваемых языков, если данные понятия выражаются в этих язах однокоренными словами.

Sab=100* ∑ Xi(AB)/ Na

где Sab – степень близости языков А и В

Xi(AB) – общий признак язов А и В

Na – общее число признаков, выражаемых в язе А

Вес признака = 1/i, где «i» номер слова в синонимическом ряду. Ш говорит, что слова заимствуются, причем одни заимствуются легко, другие сложнее, поэтому вводит

вес понятия Px= Lx*(1-kx), Lx – доля заимствованных слов для этого понятия (ведь по мере развития у понятия есть как искон, так и заимствованные названия). kx – степень устойчивости признака, это средняя энтропия этого признака, деленная на максим. энтропию.

kx= Hx/Hmax = ∑pki* log pxi/ logx

Если понятие во всех язах имеет одинаковый корень, то средняя энтропия(Hx) =0, => kx=0, Px=Lx

если все корни разные, то Hx=Hmax, => Kx=1, px=0

Понятие «зима» во всех ИЕ языках будет иметь 4 корня => K=0.32

«лето» имеет 12 корней => К = 0,55

Максим вес у понятий «вода, мать, стоять» и чисел 1-10. Минимальным весом обладают слова, которые легко заимствуются, напр «шелк», «кошка».

Первые классификации русских говоров возникли в 18 веке, они основывались на исторических данных и были примитивными, не было диалектических карт. Исключение – классификация Ломоносова 1755г., который использовал некоторые лингв. данные. Их недостатки: они умозрительны и на карту не наносились

1852 классификация Даля основывалась на лингвистических данных, охватыв. большое число говоров, большой лексич. материал, но без карты.

В 19 в. идет накопление преимущественно лексического и фонетического материала, а также морф.

В конце 19 – начале 20 в. в Петербурге под руководством Шахматова – диалектологическая комиссия русского языка создает специальные программы. ориентир. на разные языковые уровни для исследования говоров.

1915г. – Дурново, Соколов и Ушаков – последователи Шахматова, выпускают *опыт диалектической карты русского языка в Европе*, украинский и белорусский считаются наречиями. В работе есть приложение *Очерки по диалектологии*.

Великорусский: два наречия – южное и северное, есть переходное.

Северное – оканье, О и А различаются в неударн. позиц.; различение бывает полным: во всех позициях, неполным: только в первой слабой позиции. Характерно взрывное «г», твердое «т» в глаг 3Sg наст вр.

Южное – аканье – неразличение в неударной позиции О и А, фрикативное «г», мягкое «т» в глаг 3Sg наст вр.

Внутри северного и южного наречий выделяются подгруппы, но деление в каждом отдельно ведется по разным признакам: на месте «ять» произносят «э», «и» и т.д., внутри южного – яканье.

1965г. ДАРЯ – «Диалектический атлас русского языка европейской части СССР».

1770г. Захарова, Орлова – диалектическое членение русского языка, попытались положить единый признак – пучки изоглосс – линии на карте с определённым лингвистич. признаком, самый широкий пучок проходит на широте Москвы и разделяет северные и южные говоры. Все эти классификации реальные, не подразумевают взаимопроникновение. Будде и Коринский – слишком единичных случаев – нельзя выделить диалектические массивы.

 

Н.Н. Пшеничнова на основе лингв. данных создала структурную типологическую классификацию, не учитывает географию. Сравнивает 4195 диалектических говоров из ДАРЯ по 4416 признакам, вводит понятие степени близости говоров.

n – общее число признаков

r – номер признака

Возможные признаки: 1)называют ли в определенных говорах *муравьи* или *мураши*.

2) образован. мн.ч. Д.п.

wr – показатель близости говоров по признаку «r». Образование wr:

1) Если признак r есть и в том, и в другом говоре, то

где S – общее число говоров совокупности, kr – число говоров в данной совокупности, в кот. есть признак r.

2) Если в обоих говорах этого признака нет:

3) Если в одном говоре признак есть, а в другом нет:

wr = -1

wr зависит от распространенности признака.

Для случая 1): Если S примерно равно kr, т.е. kr –> 0, тогда S- kr = 0, а значит wr –> 0. Т.е. чем более распространен признак, присутствующий в обоих говорах – тем меньше показатель их близости.

Для случая 2): Если S примерно равно kr, тогда S- kr = 0, а значит wr –> ∞. Т.е. если признак есть почти во всех говорах, а ни в одном из двух сравниваемых говоров его нет – то эти говоры макс. близки по этому признаку.

Может получиться, что tij ≥ 0, тогда 2 сравниваемых объекта могут принадлежать к одной совокупности, если tij ≤ 0, то сравниваемые говоры не могут принадлежать к одной совокупности.

Если в говоре i есть признак, а в j – нет признака, то один говор будет ближе к тому, в котором есть, другой – к тому, в котором нет.

Пшеничная для сравнения говоров вводит эталон типичности – это искусственный конструкт, характеризующий данную совокупность говоров по максимально распространенным признакам (с частотой > 0.5). Это искусственный конструкт, т.к. говоров с такими признаками нет.

Она берет группу говоров, выделяет для нее эталон типичности Эт0. На начальном этапе за эталон типичности можно взять любой говор. С ним попарно сравнивают каждый говор. Получается 2 группы: Первая группа – те, которые близки к эталону (tij ≥ 0). Вторая – все остальные.

Далее выбираем новый эталон и сравниваем все говоры с ним.

Этот процесс повторяется много раз. Возможны три варианта результата:

1. Прекращение процесса: когда мы берем новый говор в качестве эталона, а состав групп изменяется (это бывает крайне редко)

2. если состав группы изменяется несущественно при следующем повторении, т.е. число говоров, ушедших из группы и пришедших в группу менее 3%.

3. когда такой стабилизации не происходит, т.е. с каждым повторением получаются группы разных раскладов.

Если имеют место 1-ый и 2-ой случаи, то мы говорим, что выделилась однородная группа, если 3-й, то наоборот.

Далее для выделившейся однородной группы выбираем эталон (здесь мы уже выводим его по частоте признаков). Для оставшейся совокупности выделяем Эт2 – это говор, который максимально непохож на Эт1. Эт2 мы выбираем так: говор, у которого показатель tij (при сравнении с Эт1) будет наименьшим. Далее мы берем Эт2 и опять сравниваем с ним все говоры для того, чтобы проверить, нет ли ошибок. Опять может быть один из трех результатов.

В итоге мы получаем группы говоров, разделенные по лингвистическим признакам.

Она вводит термины:

Группа говоров – это совокупность говоров, имеющих положительную связь (tij ≥ 0) только с эталоном данной группы.

Переходные говоры – это говоры, имеющие положительную связь (tij ≥ 0) с более чем одним эталоном. Это значит, что эти говоры сочетают черты нескольких групп, значит tij будет больше 0 с несколькими группами.

Смешанная совокупность разнородных говоров – все, что осталось.

Положительные черты этой классификации: выделение групп не зависит от выбранной точки отсчета на начальном этапе (в других же классификациях выбирается для сравнения один, якобы самый типичный, говор).

 

Проблемы количественных методов атрибуции текста. Возможности и ограничения количественной атрибуции текстов, организация выборок, аспекты сопоставления, вероятностная природа выводов.

К настоящему времени накоплен большой опыт в применении ста­тистического метода для решения проблемы спорного авторства (ат­рибуции) текстов; в сущности, этот метод стал хрестоматийным, причем не только в филологии (текстологии, источниковедении, сти­листике), но и в криминалистике, медицинской диагностике, соци­альной психологии.

Атрибуция текстов – установление авторства текста, к-й является анонимным или псевдонимным(чат).

Авторизация включает как литературную, так и лингви­стическую составляющую. Традиционные приемы, разработанные филологией: приемы содержательно-стилистического анализа, тк основные показатели – содержание и стилистика.

· Может ли данный человек написать текст такого содержания?

· В этом содержании имеются ли конкретные факты которые можно сопоставить с биогр данного автора?

· Общий стиль. Использует ли он различные ритор приемы – вопрос, антитеза, к-е можно обнаружить в данном тексте. Есть ли типичные для него обороты речи.

В. В. Виноградов в книге «Проблема авторства и теория стилей» сформулировал типологию факторов атрибуции текста. К субъективным факторам он относит: а) субъективно-коммерческие; б) субъективно-конъюнктурные; в) субъективно-эстети­ческие; г) субъективно-психологические; д) субъективно-идеологические факторы. Есть и объективные факторы: а) документально-рукописные (археологические); б) исторические (биографии, свидетельства совре­менников); в) историко-идеологические и сопоставительно-идеологи­ческие; г) историко-стилистические; д) художественно-стилистические; е) лингвостилистические. Однако чисто филологическое направление авторизации не позволяет построить объективные кри­терии анализа и атрибуции текста. Разные эксперты, используя одни и те же факторы, могут сделать совершенно различные выводы.

Перспектива объективизации экспертного знания была обнаруже­на в использовании количественных, статистических методов анализа текста.

Способы, используемые в прикл линг-ке, строгие, допускают формализацию. Самые частые количественные исслед-я опираются на знание статистических норм или вероятностных характеристик текста.

1. Частотные словари (словоформ, лемм – нач форм). Устанавливается абсолютная частота (количество вхождений единицы в текст) и относительная частота (отношение абсолютной частоты единицы к общему объему текста). Относительная частота – нормализация количественной характеристики.

Каждый частотный словарь делится на неск-ко зон:

1. Самые частотные. (как правило, служебные, самые короткие)

2. Частые знаменательные слова

3. Редкие слова(1-2 р в тексте)

Точно так же могут быть получены вероятностные оценки частоты последовательностей букв, синтаксических структур, предложений разной длины.

Сопоставляется спорный текст и уже имеющий атрибуцию. Впервые – 1880е гг Диттенбергер, атрибуция «диалогов» Платона. Он исследовал частоты служебных слов в подлиннике и спорных текстах. Тк частоты служебных слов зависят не от тематики текста, а от общего стиля текста.

1915- работа Морозова посвященная частотности ед-ц языка в текстах и возм-ти их использовать для атрибуции.

Атрибуция Тихого Дона – самая известная атрибуция, 89 г.

признаки:

1. Осуществление выборки с одной стороны из нескольких произведений Шолохова и автора чье авторство подозревалось – Ф. Крюков.

2. В этих выборках не должны были встречаться эл-ты прямой речи

3. Нельзя использовать не «собственно прямую речь» - где автор передает мысли, чувства героев, совмещая свою речь с речью персонажей.

4. При выборках исп-ся разные части текстов – начало, средняя, заключительная

5. Организация выборки – либо случайным образом, либо структурированной выборкой – чтобы в нее обязательно вошли разные части текста.

Что сравнивали:

Длина предложений, количество символов, число текстоформ, число слогов

1. Длина слов в символах

2. Статистика классов слов, те частей речи.

3. Частоты разных начал и концов текста.

Вся выборка – 1000 предложений. Выводы: по всем частотным показателям тексты Тиххого Дона ближе к Шолоховским.

Длина предложения: Крюков – 13, 9

Шолохов – 12,9

Тихий Дон – 12,4

 

Атрибуция текстов. При решении таких традиционных филологи­ческих задач, как атрибуция анонимного или псевдонимного текста, определение или уточнение датировки текста, типология жанров и Функциональных стилей, становится очевидно, что, по мнению М.А. Марусенко, во всех вышеперечисленных случаях мы имеем дело только с одной научной задачей — либо с объединением объектов в однородные классы, либо с отнесением объекта (группы объектов) к какому-либо классу, либо с определением меры близости/удаленнос­ти между разными объектами (группами объектов).

При всей актуальности этих проблем и несмотря на то, что работа над ними ведется со времен филологов-классиков, нынешнее состо­яние дел не позволяет однозначно и с фиксированной достовернос­тью производить атрибуцию анонимного или псевдонимного текста как и другие классификационные процедуры. Произведения ано­нимного или спорного авторства существуют в любой литературе. До настоящего времени процедура атрибуции таких текстов сводилась к тому, что филолог-литературовед, хорошо знакомый с периодом, в который был написан спорный текст, и с творчеством писателей, ра­ботавших в то время, пытался найти те или иные доказательства, поз­воляющие приписать данный текст известному ему автору. При этом самым важным являлись свидетельства внешнего характера, такие, как биографические данные предполагаемого автора, его пребыва­ние в данном месте, круг его знакомств, переписка, политические взгляды и т.д. Пользуясь этим методом, разные исследователи зачас­тую приходят к совершенно противоположным выводам относитель­но предполагаемого автора анализируемого текста. Необходимо учи­тывать и субъективный фактор, который оказывает негативное воздействие в двух планах: с одной стороны, исследователи выбира­ют в качестве оснований для атрибуции те критерии, которые лучше «укладываются» в их гипотезу, с другой — проявляется отчетливая тенденция приписывать спорные тексты перу наиболее крупных и значительных писателей.
Новые перспективы в этой области открываются при комплекс­ном подходе к проблеме атрибуции, когда для признания принадлеж­ности анализируемого произведения данному автору необходимо учитывать доводы по меньшей мере трех основных групп: а) биогра­фические; б) идеологические; в) стилистические. Чем большее число разных методов используется в процессе атрибуции, тем выше его точность и надежность, достоверность окончательных выводов.

Совершенствование исследовательских приемов связано с исполь­зованием средств и методов прикладной лингвистики, а также с чет­ким разграничением сферы действия и возможностей традиционных филологических методов, их комплексным сочетанием со статисти-ко-вероятностными методами, разработанными для решения класси­фикационных задач и применяемых для задач атрибуции на основе межнаучного переноса.

 

Авторизация/атрибуция текста. Проблема авторизации текста отно­сится к числу классических проблем филологического исследования. Часто она рассматривается в рамках «количественной стилистики» — стилеметрии. Авторизация включает как литературную, так и лингви­стическую составляющую. Чисто филологическое направление авторизации не позволяет построить объективные операциональные кри­терии анализа и атрибуции текста (разные эксперты, используя одни и те же факторы, могут сделать совершенно различные выводы). Особенности употребления служебных слов, лексем с общей семантикой, не привязанной к тематике художественного произведения, формируют авторский стиль и практически не поддаются имитации.

В настоящее время развитие методик авторизации текста наиболее продуктивно проходит в рамках стилеметрии. Лингвистические основа­ния авторизации могут быть различны, но использование количествен­ных методов анализа оказывается неизбежным. Одно из перспективных направлений в этой области — привлечение к авторизации текста тео­рии распознавания образов. При таком подходе стиль описывается как пространство количественно выразимых параметров — средняя длина предложения, количество вложенных синтаксических структур, количе­ство слов в предложении, количество предложений в абзаце и т.д. Далее каждый анализируемый текст выражается через вектор, координаты ко­торого задаются значениями выбранных параметров. Сходство векторов определяет и сходство стилей.

Одна из наиболее распространенных областей использования зна­ний о статистических закономерностях языковых явлений — экспертиза авторства текста. Типологически можно представить следующие базовые ситуации экспертного анализа.

A. Множественная неопределенность. Имеется множество текстов или их фрагментов. Необходимо установить, скольким авторам принадлежат тексты, и атрибутировать каждый текст конкретному автору. Это, разумеется, наиболее сложный случай анализа.

Б. Сравнение по образцу. Имеется пример текста (текстов) некоторого автора X. Необходимо установить, является ли он и автором некоторого другого текста (текстов).

B. Конкуренция образцов. Имеются образцы текстов авторов X,Y,Z.... Необходимо установить, кто из них является автором текстов Т12,...,Тn

Автороведческая экспертиза — исследование текста (чаще всего — печатного) с целью установления авторства либо получения сведений об авторе.

Предметом автороведческой экспертизы является текст. В качестве текста могут выступать, по отдельности либо в совокупности, различные записи (например, дневниковые), письма, официальные документы, литературные произведения, тексты публичных выступлений и т. д. В отличие от почерковедческой экспертизы, объектом исследования является не графическое исполнение текста, а само его содержание.

Задачи экспертизы разделяются на две группы:

Идентификационные — проверка авторства. Подтверждение авторства определённого лица. Исключение авторства определённого лица. Проверка того, что автором всего текста был один и тот же человек. Проверка того, что исполнитель текста является одновременно его автором. Идентификационные задачи автороведческой экспертизы решаются в тех случаях, когда требуется подтвердить или опровергнуть авторство определённого лица (лиц) по отношению к тому или иному тексту, причём предполагаемый автор текста известен и непосредственно доступен. Наиболее очевидные примеры — доказательство или опровержение факта литературного плагиата и доказательство авторства в делах, связанных с правами на литературные произведения.

Диагностические. Определение личностных характеристик автора, таких как: Образовательный уровень. Область деятельности, профессия, хобби. Пол, возраст, социальное положение, национальность и прочие социальные характеристики. Наличие навыков определённого стиля письменной речи. Определение факта сознательного искажения письменной речи.

Диагностические задачи экспертиза решает в тех случаях, когда необходимо установить неизвестного автора имеющегося в наличии текста, например, определить автора анонимного письма или подложного документа. В этих случаях сопоставить исследуемый текст с текстами автора, как правило, невозможно, и экспертиза заключается в выявлении на основании текста личностных характеристик автора, знание которых позволит ограничить круг лиц, подлежащих проверке уже другими методами.

Методы. Она базируется на представлении, что для каждого человека характерен уникальный комплекс особенностей речевого поведения, который может быть опознан и использован для идентификации и диагностики. Вся совокупность методов экспертизы направлена на выделение этих особенностей, их описание и сравнение.Методы автороведческой экспертизы исследуют анализируемый текст на четырёх уровнях: пунктуационном, орфографическом, синтаксическом, лексико-фразеологическом, стилистическом.

Пунктуационный — особенности употребления автором знаков препинания, характерные ошибки. Орфографический — характерные ошибки в написании слов. Синтаксический — особенности построения предложений, предпочтение тех или иных языковых конструкций, употребление времён, активного или пассивного залога, порядок слов, характерные синтаксические ошибки. Лексико-фразеологический — словарный запас автора, особенности использования слов и выражений, склонность к употреблению редких и иностранных слов, диалектизмов, архаизмов, неологизмов, профессионализмов, арготизмов и так далее. Сюда же относятся навыки употребления фразеологизмов, пословиц, поговорок, «крылатых выражений». Стилистический — жанр, общая структура текста, для литературных произведений — сюжет, характерные изобразительные средства (метафора, ирония, аллегория, гипербола, сравнение), стилистические фигуры (градация, антитеза, риторический вопрос и так далее), другие характерные речевые приёмы.

Существует достаточно много методов анализа стиля. В целом можно разделить их на две большие группы - экспертные и формальные. Первые предполагают исследование текста профессиональным лингвистом-экспертом, который выделит характерные особенности проверяемого текста, текстов, написанных предполагаемым автором, если они доступны, и на основании их изучения вынесет заключение. Вторые основаны на сравнении некоторых, формально вычислимых, характеристик текстов.

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-02-12 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: