Чем больше по объему текст, тем объективнее результаты исследования.




Количественное исследование текстов (и, в частности, идиостиля автора) становится по-настоящему объективным, если оно имеет сравнительный характер (предполагает сопоставление с текстами других авторов).

Корректным является сопоставление текстов, написанных приблизительно в одно время.

Лингвистика текста: «корпусная философия»

АОТ: разные уровни применения.

Существущие корпуса. «Литературоцентричность» НКРЯ.

Идиостилевые словари (в том числе частотные).

Словари языка писателя

Стилевые и частотные словари А. С. Пушкина, Л. Андреева, А. Блока, И. Гончарова, А. Грибоедова, А. Дельвига, Ф. Достоевского, А. Чехова, В. Шукшина, поэзии 1-й пол. ХХ в. …

! Проблема отражения специфики идиостиля.

Новый частотный словарь русской лексики

Под ред. С. А. Шарова и О. Н. Ляшевской

https://dict.ruslang.ru/freq.php

Основан на данных Национального корпуса русского языка

Содержит информацию о встречаемости слов в текстах разных функц. стилей (в том числе и в художественных текстах)

Возможности АОТ и корпусов

Как отразить в исследовании языка писателя именно то индивидуальное, что характеризует язык его произведений?

Вопрос о лексико-статистической методике.

?

В какой степени набор самых частотных слов неанонимного текста может характеризовать стиль автора и отражать его индивидуальную картину мира?

! Проблема определения авторства анонимного текста не рассматривается.

Лексическая статистика и идиостиль автора

Абсолютная частотность слова в тексте сама по себе не может являться показательной для анализа концептуальной системы автора. Существуют слова типа быть, человек, глаз, город, говорить, видеть, хотеть и т.д., часто встречающиеся практически в любом художественном тексте.

«Топ» лексической частотности по А. О. Гребенникову

А. П. Чехов: говорить, сказать, один, мочь, знать, глаз, человек, рука, лицо, два, стать, глядеть, думать, большой, жизнь, идти, день, голова, сидеть, видеть, другой, жить, дом, казаться, раз, спать, дело, время, жена, люди, бог, взять…

Л. Н. Андреев (рука, глаз, сказать, говорить, мочь, лицо, другой, знать, голова, отец, люди, человек, стать, жизнь, смотреть, видеть, слово, думать, нога, хотеть, голос, идти, день, казаться, раз, земля, женщина, дом, черный, два, ночь, стоять…

Гипотеза

Сверхчастотные слова, являющиеся универсальными для текстов разных авторов можно отсечь и рассмотреть индивидуально-авторский «слой».

Сопоставительный принцип анализа

точную и полную выборку слов, отражающих стиль автора, может обеспечить только сравнительный количественный анализ.

Еще раз, потому что важно:

Материалом должны стать по крайней мере три автора и не менее трех произведений каждого из них.

Чем больше по объему текст, тем объективнее результаты.

Сопоставлять необходимо тексты, написанные приблизительно в одно время.

Произведений

Четырех известнейших

Русских романистов ХХ в.

(около 1,5 млн словоупотреблений):

М. Булгаков, В. Набоков, А. Платонов, М. Шолохов:

Почему именно они?

самые «крупные» (в смысле формы и количества текстов)

Самые лучшие (? – вкусовой критерий)

Самые известные, признаны классиками

Все писали по-русски

Обладают яркой индивидуальностью

Работали примерно в одно время

Вероятно, индивидуальные стилевые особенности должны отражать

Слова, попадающие в «пик частотности» двух и более произведений одного автора и не более чем в одно чужое произведение (самая показательная группа)

Объект рассмотрения – знаменательная лексика

Леммы, извлеченные из текстов, упорядочены по частоте

Выбрано по 1000 самых частотных в каждом тексте

Сформированы группы слов, частотных для одного писателя и нечастотных для других.

М. Булгаков: пьеса, кот, король, сцена, актер, роман, глава, публика, вскричать, передняя, переулок, автор, директор… 148 слов, 5949 контекстов

В. Набоков: игра, платье, странно, сперва, гостиница, журнал, блеск, столовая, приниматься, панель, стеклянный… 196 слов, 5322 контекста

А. Платонов: коммунизм, паровоз, природа, пролетариат, социализм, пища, масса, скучно, пространство, тосковать… 292 слова, 7653 контекста

М. Шолохов: казак, хутор, полк, дед, зараз, станица, бык, фронт, казачий, крыльцо, парень, седло, рубаха… 192 слова, 20929 контекстов

Для сравнения («абсолютный» список самых частотных):

быть, сказать, еще, уже, один, мочь, знать, рука, говорить, человек, очень, стать, вдруг, глаз, теперь, год, день, опять, лицо, потом, дверь, комната, два, нет, время, выходить, жизнь, сидеть, первый, отец, тут, голова, понимать, раз, думать, идти, казаться, дом, жена, видеть, пойти, черный, голос, спрашивать, слово, стоять, ничего, мысль, дело, нога, находить, стол, сразу, окно, хотеть, сейчас, глядеть, белый, смотреть, подумать…

(К авторской лексикографии)



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-04-01 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: