Остаточная энтропия языка и сложность.




 

Начало второй половины XX-го века ознаменовалось несколькими крупными открытиями, которые обозначили новый этап в развитии науки в целом. Назову те из них, которые вошли в научный обиход на моих глазах в период моего научного становления и подтвердили важность дешифровочного подхода (который стал моделью всех крупных научных достижений): для меня самыми значительными были обнаружение в 1953 г. генетического кода[92] (результат подготовивших работу Крика и Уотсона исследований, с самого начала, в поисковых работах Гамова, ориентировавшихся на лингвистическую модель), выявление реликтового излучения (подтвердившего надежность методов реконструкции исходного состояния в физике и космологии: между высказанным тем же Гамовым в 1948 г. предположением о возможности этого излучения и его открытием в 1965 г. прошло 17 лет), дешифровка в 1952 г.[93] письменности майя Ю.В.Кнорозовым (основанная на его теории коммуникации, тем самым прошедшую проверку опытом) и в 1956 г. крито-микенской письменности Вентрисом и Чедвиком (которые убедительно показали значимость выявления формальных структур[94]). Но едва ли не самым поразительным для всего моего поколения было знакомство с теорией информации, которая дала возможность измерять то, что относится к духовной деятельности человека, необычайно раздвинув тем самым границы точного человеческого знания. Меня заинтересовала работа Шеннона о теоретико-информационном подходе к дешифровке (вскоре удалось вместе со Шрейдером и Пробстом приступить к реализации кнорозовского проекта дешифровки с частичной помощью компьютеров). Мне кроме того еще повезло в том отношении, что я в 1960 –1963 гг. принимал участие в тех занятиях А.Н. Колмогорова[95] стихом и языком, которые привели к созданию его теоретико-информационной модели стиха, а потом и к идее сложности.

Энтропия языка по А.Н. Колмогорову складывается из чисто смысловой информации или информационной емкости (h1) и гибкости или остаточной энтропии (мера синонимии g= h2):

(1) H= h1 + h2.

Поскольку второе из этих слагаемых может быть получено из энтропии в целом путем вычитания другой составляющей – информационной емкости, в том же смысле можно говорить об остаточной энтропии: та энтропия, которая остается после выражения определенных мыслей, может быть затрачена на избранный метр, переносы, характер рифмовки и другие особенности художественной формы. Эти затраты энтропии на поэтическую форму могут быть точно подсчитаны. Если коэффициент b, характеризующий ограничения, налагаемые стихотворной формой, и определяющий соответствующую свободу обращения поэта со словесным материалом, больше гибкости языка или остаточной энтропии g:

(2) b > g,

то выражение заданной мысли в данной форме невозможно. Поэтому неравенство

(3) g < b

является необходимым условием для осмысленного поэтического творчества и стихотворного перевода.

Энтропия языка в общем случае при комбинаторном подходе понимается Колмогоровым как «показатель разветвленности возможностей продолжения речи при данном словаре и данных правилах построения фраз»[96]; для русского языка в целом она была оценена сотрудниками Колмогорова как

(4) H= 1,9 ± 0,1.

Однако стилистические ограничения, характеризующие литературный жанр, снижают оценку энтропии, получаемой при угадывании последующих букв, до

(5) Hlit= 1,1 ± 0,1.

Для русского классического рифмованного ямба затраты остаточной энтропии по Колмогорову составляют

(6) h2= 0, 4.

В таком случае информационная емкость для этого жанра русского языка предположительно характеризуется как

(7) h1= Hlit – h2= 1,1-0, 4= 0,7.

Эту последнюю величину можно также оценить экспериментально, сравнив между собой разные русские переводы одного и того же иностранного текста или разные русские словесные описания ситуации, изображенной на одной и той же картине, схеме или географической карте. Исследованием синонимии в последние десятилетия также занимались специалисты по лексической семантике, которые (иногда – как Анна Вержбицкая – прямо следуя за давней мыслью Лейбница) пробовали ввести набор основных семантических единиц. С их помощью можно описать более отвлеченную часть обиходного словаря языка и синонимические преобразования, его характеризующие. Можно надеяться, что развитие исследований синонимии естественного языка (в частности, русского, для которого в последнее время выполнены работы по синонимическому словарю, идущие в том же направлении) может привести и к оценке той остаточной энтропии, которая характеризует гибкость языка. При усложнении поэтической формы и соответственном повышении затрат на нее остаточной энтропии гибкость поэтического языка может быть увеличена путем более широкого употребления слов в метафорических значениях. Семантическая структура языка запрещает только смешение значений слов внутри одного конкретного семантического поля (например, названий музыкальных инструментов или растений и их частей), но в поэтическом языке любое слово одного семантического поля может быть использовано как метафорическое обозначение денотата слова другого семантического поля (Стволы извилисты иголы Как будто арфы и виолы у Мандельштама). Поэтому повышенная образность произведений с особенно изощренной поэтической формой (например, «Божественной комедии» и продолжающих ту же традицию терцин Пушкина и Блока) легко объясняется в соответствии с неравенством (3).

С этой точки зрения для сравнительно-исторической поэтики значительный интерес может представить техника древнеисландских кеннингов, для которых в работах по реконструкции индоевропейской поэзии указаны прообразы в кеннингах общеиндоевропейских (отраженных уже у Гесиода и Гомера). Логическая структура кеннингов изучалась Ю.И. Маниным. Значительное повышение гибкости языка древнеисландских аллитеративных стихов, достигаемое благодаря систематическому использованию кеннингов, указывает на то, что при жесткости формальных ограничений, наложенных на стих, оказывалось необходимым повышение остаточной энтропии.

Обе введенные Колмогоровым величины – чисто смысловая информация (h1) и гибкость или остаточная энтропия (мера синонимии g= h2) могут быть оценены количественно, что представляет собой значительный шаг вперед по пути создания эстетики как экспериментальной научной дисциплины, о чем мечтал еще Андрей Белый. Сама необходимость и возможность дать оценку каждой из этих двух величин в их взаимозависимости обусловлены двусторонним знаковым характером поэтического текста – наличием в нем плана содержания (семантики) и плана выражения, в письменном языке кодируемого буквенным письмом (отсюда расчеты количества информации, приходящегося на одну букву текста). Занятия этой областью стохастической семиотики подвели Колмогорова к выработке теории сложности, представляющей также крупный шаг в развитии тех аспектов математического знания, которые важны для науки в целом. В частности, им были предложены методы исследования уникального сообщения, не входящего в совокупность других сообщений, подобных данному, а стоящего вполне особняком (случай, особенно важный для истории художественной литературы и других видов искусства).

Отчетливое понимание этой особенности словесного и других искусств привело Колмогорова к такому изложению основ теории информации, которое строится вне обращения к теории вероятностей. Вместе с тем понятия «энтропии» и «количества информации» оказываются применимыми к индивидуальным объектам, в частности, таким, которые являются произведениями художественной литературы или других видов искусства.

Благодаря этому толкованию теории информации в контексте теории алгоритмов центральным становится понятие сложности программы P, по которой строится индивидуальное сообщение. Сложность определяется длиной этой программы.

Современная математическая теория стиха, позволяющая приближенно оценить сложность программы построения cтихотворного текста, может быть одной из иллюстраций подобного подхода к индивидуальным сообщениям.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2022-11-01 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: