в последовательной выборке




Об одном парадоксе закона больших чисел для максимальных серий

 

© 2008 Плотников Андрей Николаевич

 

Самарский государственный аэрокосмический университет им. Академика С.П. Королёва,

443086, г. Самара, Московское шоссе, 34. Кандидат технических наук, доцент кафедры производства

летательных аппаратов и управления качеством в машиностроении.

Тел. (846) 267-46-28, (846) 241-19-20, e-mail:metatlas@yandex.ru (для Плотникова А.Н.)

 

Дополнены и уточнены ранее опубликованные результаты исследования закономерностей формирования серий в последовательной выборке. Получены предельные формы законов распределения длины максимальных серий, образуемых положением относительно медианы и отношением порядка между соседними индивидуальными значениями. Установлено, что предельная форма распределения длины максимальной серии отношений порядка ведет себя парадоксальным образом, циклически эволюционируя от вырожденного распределения с изолированной модой до бинарного с модой, симметрично расщепленной на два подряд стоящих значения.

 

Ключевые слова: последовательная выборка, длина максимальной серии, закон больших чисел, структура серий, критерии случайности.

 

1. Серии в последовательной выборке, представляющие собой группы подряд стоящих индивидуальных значений, расположенных по одну сторону от медианы (знаковые серии) или образующих монотонную последовательность (трендовые серии), как было показано в , имеют отчетливую спектральную структуру с устойчивой воспроизводимостью. В был получен точный закон распределения длины максимальной серии обоих типов. В установлен закон распределения числа серий фиксированной длины и получены его нормальные (для коротких серий ) и Пуассоновские (для ) асимптотики при большой длине последовательности. Последние из указанных результатов легко позволяют установить предельную форму закона распределения максимальной длины серий. При этом, как оказывается, предельная форма распределения максимальной трендовой серии обладает довольно неожиданным свойством, которое без преувеличения можно назвать «парадоксом вырождения». Этот парадокс заключается в том, что при неограниченном возрастании длины последовательности длина максимальной трендовой серии перестает быть случайной, т.е вырождается в фиксированное значение: .

Причем, с дальнейшим возрастанием эта изолированная мода расщепляется на две, и вторая мода , постепенно возрастая, сравнивается с первой: . Затем вторая мода поглощает первую (распределение опять вырождается), и это процесс закономерно циклически повторяется. При умеренно больших этот эффект проявляет себя, как показано в , в виде апериодических колебаний дисперсии и моментов более высокого порядка.

Серии первого типа (знаковые) ведут себя не столь парадоксально. Их предельная форма рассеяния подобно выборочному размаху является стационарной и смещается вправо по оси со скоростью .

 

2. Асимптотику распределения длины максимальной серии найдем, используя полученные в Пуассоновские оценки для числа нерекуррентных серий фиксированной длины . Для знаковой серии длины , расположенной выше медианы в последовательности длиной эта оценка, согласно , составляет: . Используя двойственность величин и , ряд распределения последней можно записать в виде:

. (1)

 

Подставив в (1) Пуассоновские вероятности, получим:

 

(2)

 

Асимптотический ряд (2) очевидно сходится к 1 как .

Для величины , собственно и являющейся максимальной длиной знаковой серии, определённой согласно [1], ряд распределения найдём по формуле максимума двух независимых величин с одинаковым законом распределения:

(3)

Подставляя в (3) члены ряда (2) и пренебрегая слагаемыми , получим . (4)

Для рядов (2), (4) очевидно тождество или, что фактически то же самое, .

Таким образом, ряд (4) сдвинут на 1 вправо по оси l относительно ряда (2).

Переходя в (4) к величине

(5)

получаем независящую от n предельную форму (4):

, (6)

вид которой с последующим квантованием показан на Рис.1. Числовые характеристики (6) равны:

, (7)

, (8)

где - Эйлеровы интегралы : ; в (8)- поправка на группировку (6). Таким образом, среднее значение длины максимальной знаковой серии составит

, (9)

дисперсия определяется согласно (8), а предельная форма рассеяния имеет вид (6).

 

Рис.1. Предельное распределение длины максимальной «знаковой» серии и его сглаживающая кривая.

3. По аналогичной схеме, используя Пуассоновские оценки для трендовых серий [2]:

,

получаем:

(10)

Сумма ряда (10) составит:

(11)

По аналогии с (3), (4), для получаем

(12)

В дальнейшем, поскольку речь идет о больших , различием между и в (10)-(12) пренебрежем и положим , где - константа ~1.

Для соседних членов ряда (12) с номерами и будет иметь:

(13)

Приравняв , получим

. (14)

Таким образом, последовательность

(15)

соответствует наличию симметрично расщепленной двойной изолированной моды: (остальные члены ряда (12) в сумме составляют ничтожно малую вероятность, и распределение становится «почти вырожденным»).

Последовательность значений , соответствующих полному вырождению (изолированной моде) будем искать в виде:

, (16)

где определим из условия . Для члена ряда (12) с номером будем иметь:

. (17)

Подстановкой приходим к функции вида

, (18)

максимум которой достигается в точке

, (19)

откуда, после обратной подстановки, находим

. (20)

Таким образом, значения

(21)

соответствуют фазе существования изолированной моды (полного вырождения закона распределения): .

Область значений соответствует периоду «зарождения» и роста второй моды . Затем, на интервале новая мода «поглощает» старую, и процесс циклически повторяется. Эволюция ряда (12) в зависимости от n показана на Рис.2. При этом фазы полного вырождения рядов (10), (12) совпадают между собой, и (3) преобразуется к виду .

Рис.2. Эволюция распределения длины максимальной трендовой серии. Фазы изолированной и симметрично расщепленной моды при n =4.178×105; 1.258×106; 6.143×108; 2.158×109; 4.108×1022; 2.150×1023 (слева направо).

 

В фазе расщепления моды (12) соотношение (3) примет вид:

. (22)

При этом в точке симметрии мода расщепляется в пропорции . С возрастанием длины последовательности до мода становится симметричной, а значения перенормируются как .

Таким образом, длина максимальной трендовой серии в большой последовательной выборке становится величиной, закономерно возрастающей с увеличением объема выборки (неслучайной). Тем самым, она не только является надежным критерием случайности выборки, но и, как представляется, сможет послужить ключом к объяснению некоторых, еще не до конца понятых закономерностей в реальных стохастических процессах, в частности, в процессах диффузии и им подобных.

 

 

Литература

 

 

1. Плотников, А.Н. Закон распределения длины максимальной серии и его статистические приложения. / А.Н. Плотников // Известия Самарского научного центра РАН, 2006. Т. 8, №4- С.1047-1056.

2. Плотников, А.Н. Об инвариантах структуры серий и критериях случайности последовательной выборки. / А.Н. Плотников // Известия Самарского научного центра РАН, 2006. Т.8, №4.- С.1142-1147.

3. Крамер, Г. Математические методы статистики / Г. Крамер. — М.: Мир, 1976.

4. Корн, Г., Корн, Т. Справочник по математике / Г. Корн, Т. Корн. — М.: Наука, 1984.

 

 

Гл 5 пр 1,2.

Статистическое моделирование процессов. Критерии случайности на основе закона распределения серий



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2019-04-14 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: