П-3. Теоремы о наследовании сходимости




Суть проблемы наследования сходимости. Пусть распределения случайных величин Xn при n → ∞ стремятся к распределению случайной величины Х. При каких функциях f можно утверждать, что распределения случайных величин f (Xn)сходятся к распределению f (X), т.е. наследуется сходимость?

Хорошо известно, что для непрерывных функций f сходимость наследуется [3]. Однако в прикладной статистике и, в частности, в нечисловой статистике используются различные обобщения этого утверждения. Необходимость обобщений связана с тремя обстоятельствами.

1) Статистические данные могут моделироваться не только случайными величинами, но и случайными векторами, случайными множествами, случайными элементами произвольной природы (т.е. функциями на вероятностном пространстве со значениями в произвольном множестве).

2) Переход к пределу должен рассматриваться не только для случая безграничного возрастания объема выборки, но и в более общих случаях. Например, если в постановке статистической задачи участвуют несколько выборок объемов n (1), n (2), …, n (k), то вполне обычным является предположение о безграничном росте всех этих объемов (что можно описать и как min { n (1), n (2), …, n (k)} → ∞).

3) Функция f не обязательно является непрерывной. Она может иметь разрывы. Кроме того, она может зависеть от параметров, по которым происходит переход к пределу. Например, может зависеть от объемов выборок. Если в постановке статистической задачи участвуют несколько выборок объемов n (1), n (2), …, n (k), то, как правило, необходимо рассматривать функции вида f = f (n (1), n (2), …, n (k)).

Расстояние Прохорова и сходимость по направленному множеству. Введем необходимые для дальнейшего изложения понятия.

Для определения расстояния (метрики) Прохорова нужны предварительные определения.Пусть С – некоторое пространство, А – его подмножество, d – метрика в С. Введем понятие ε-окрестности множества А в метрике d:

S (A,ε) = { x С: d (A, x) < ε}.

Таким образом, ε-окрестность множества А – это совокупность всех точек пространства С, отстоящих от А не более чем на положительное число ε. При этом расстояние от точки х до множества А – это точная нижняя грань расстояний от х до точек множества А, т.е.

d (A, x) = inf{ d (x,y): y A }.

Пусть P 1 и P 2 – две вероятностные меры на С (т.е. распределения двух случайных элементов со значениями в С). Пусть D 12 – множество чисел ε > 0 таких, что

P 1(A) < P 2(S (A,ε)+ε

для любого замкнутого подмножества А пространства С. Пусть D 21 – множество чисел ε > 0 таких, что

P 2(A) < P 1(S (A,ε)+ε

для любого замкнутого подмножества А пространства С. Расстояние Прохорова L (P 1, P 2) между вероятностными мерами (его можно рассматривать и как расстояние между случайными элементами с распределениями P 1 и P 2 соответственно) вводится формулой

L (P 1, P 2) = max (inf D 12, inf D 21).

С помощью метрики Прохорова формализуется понятие сходимости распределений случайных элементов в произвольном пространстве.

Расстояние L (P 1, P 2) введено академиком РАН Юрием Васильевичем Прохоровым в середине ХХ в. и широко используется в современной теории вероятностей.

Сходимость по направленному множеству [4, с.95-96]. Бинарное отношение > (упорядочение), заданное на множестве В, называется направлением на нем, если В не пусто и

(а) если m, n и p – такие элементы множества В, что m > n и n > p, то m > p;

(б) m > m для любого m из B;

(в) если m и n принадлежат B, то найдется элемент p из B такой, что p > m и p > n.

Направленное множество – это пара (В, >), где > - направление на множестве В. Направленностью (или «последовательностью по направленному множеству») называется пара (f, >), где f – функция, > - направление на ее области определения. Пусть f: BY, где Y – топологическое пространство. Направленность (f, >) сходится в топологическом пространстве Y к точке y 0, если для любой окрестности U точки y 0 найдется p из B такое, что f (q) U при любом q > p. В таком случае говорят также о сходимости по направленному множеству.

Пусть В = {(n (1), n (2), …, n (k))} – совокупность векторов, каждый из которых составлен из объемов k выборок. Пусть

(n (1), n (2), …, n (k)) > (n 1(1), n 1(2), …, n 1(k))

тогда и только тогда, когда n (i) > n 1(i) при всех i = 1, 2, …, k. Тогда (В, >) – направленное множество, сходимость по которому эквивалентна сходимости при min { n (1), n (2), …, n (k)} → ∞.

Чтобы охватить различные частные случаи, целесообразно предельные теоремы формулировать в терминах сходимости по направленному множеству. Будем писать B = {α}. Пусть запись α→∞ обозначает переход к пределу по направленному множеству.

Формулировка проблемы наследования сходимости. Пусть случайные элементы X α со значениями в пространстве С сходятся при α→∞ к случайному элементу Х, где через α→∞ обозначен переход к пределу по направленному множеству. Сходимость случайных элементов означает, что L (X α, X) → 0 при α→∞, где L – метрика Прохорова в пространстве С.

Пусть f α: CY – некоторые функции. Какие условия надо на них наложить, чтобы из L (X α, X) → 0 вытекало, что L 1(f α(X α), f α(X)) → 0 при α→∞, где L 1 – метрика Прохорова в пространстве Y? Другими словами, какие условия на функции f α: CY гарантируют наследование сходимости?

В работах [5, 6] найдены необходимые и достаточные условия на функции f α: CY, гарантирующие наследование сходимости. Описанию этих условий посвящена оставшаяся часть настоящего раздела П-3.

Приведем для полноты изложения строгие формулировки математических предположений.

Математические предположения. Пусть С и У – полные сепарабельные метрические пространства, Пусть выполнены обычные предположения измеримости: Х α и Х – случайные элементы С, f α(Х α) и f α(Х) – случайные элементы в У, рассматриваемые ниже подмножества пространств С и У лежат в соответствующих σ–алгебрах измеримых подмножеств, и т.д.

Понадобятся некоторые определения. Разбиение Тn = { C 1n, C 2 n, …, Cnn } пространства С – это такой набор подмножеств Cj, j = 1, 2, …, n, этого пространства, что пересечение любых двух из них пусто, а объединение совпадает с С. Диаметром diam (A) подмножества А множества С называется точная верхняя грань расстояний между элементами А, т.е.

diam (A) = sup { d (x, y), x A, y A },

где d (x, y) – метрика в пространстве С. Обозначим ∂ А границу множества А, т.е. совокупность точек х таких, что любая их окрестность U (x) имеет непустое пересечение как с А, так и с C \ А. Колебанием δ(f, B) функции f на множестве B называется δ(f, B) = sup {| f (x) – f (y)|, x B, y B }.

Достаточное условие для наследования сходимости. Пусть L (X α, X) → 0 при α → ∞. Пусть существует последовательность Тn разбиений пространства С такая, что Р (Х А) = 0 для любого А из Тn и, основное условие, для любого ε > 0

(1)

при n →∞ и α→∞, где сумма берется по всем тем А из Тn, для которых колебание функции f α на А больше ε, т.е. δ(f α, А) > ε. Тогда L 1(f α(X α), f α(X)) → 0 при α→∞.

Необходимое условие для наследования сходимости. Пусть У – конечномерное линейное пространство, У = Rk. Пусть случайные элементы f α(X) асимптотически ограничены по вероятности при α→∞, т.е. для любого ε > 0 существуют число S (ε) и элемент направленного множества α(ε) такие, что Р (|| f α(X)||> S (ε))<ε при α > α(ε), где || f α(X)|| - норма (длина) вектора f α(X). Пусть существует последовательность Тn разбиений пространства С такая, что

,

т.е. последовательность Тn является безгранично измельчающейся. Самое существенное – пусть условие (1) не выполнено для последовательности Тn. Тогда существует последовательность случайных элементов X α такая, что L (X α, X) → 0 при α → ∞, но L 1(f α(X α), f α(X)) не сходится к 0 при α → ∞.

Несколько огрубляя, можно сказать, что условие (1) является необходимым и достаточным для наследования сходимости.

Пример 1. Пусть С и У – конечномерные линейные пространства, функции f α не зависят от α, т.е. f αf, причем функция f ограничена. Тогда условие (1) эквивалентно требованию интегрируемости по Риману-Стилтьесу функции f по мере G (A) = P (X A). В частности, условие (1) выполнено для непрерывной функции f.

В конечномерных пространствах С вместо сходимости L (X α, X) → 0 при α → ∞ можно говорить о слабой сходимости функций распределения случайных векторов X α к функции распределения случайного вектора X. Речь идет о «сходимости по распределению», т.е. о сходимости во всех точках непрерывности функции распределения случайного вектора X. В этом случае разбиения могут состоять из многомерных параллелепипедов [5, гл.2].

Пример 2. Полученные выше результаты дают обоснование для рассуждений типа следующего. Пусть по двум независимым выборкам объемов m и n соответственно построены статистики Xm и Yn. Пусть известно, что распределения этих статистик сходятся при безграничном росте объемов выборок к стандартному нормальному распределению с математическим ожиданием 0 и дисперсией 1. Пусть a (m, n) и b (m, n) – некоторые коэффициенты. Тогда согласно результатам примера 1 распределение случайной величины Z (m, n) = a (m, n) Xm + b (m, n) Yn сближается с распределением нормально распределенной случайной величины с математическим ожиданием 0 и дисперсией a 2(m, n) + b 2(m, n). Если же a 2(m, n) + b 2(m, n) = 1, например,

,

то распределение Z (m, n) сходится при безграничном росте объемов выборок к стандартному нормальному распределению с математическим ожиданием 0 и дисперсией 1.

 

П-4. Метод линеаризации

При разработке методов прикладной статистики и, в частности, нечисловой статистики часто возникает следующая задача [3, с.338]. Имеется последовательность k -мерных случайных векторов Xn = (X 1 n, X 2 n, …, Xkn), n = 1, 2, …, такая, что Xna = (a 1, a 2, …, ak) при n → ∞, и последовательность функций fn: RkR 1. Требуется найти распределение случайной величины fn (Xn).

Основная идея – рассмотреть главный линейный член функции fn в окрестности точки а. Из математического анализа известно, что

,

где остаточный член является бесконечно малой величиной более высокого порядка малости, чем линейный член. Таким образом, произвольная функция может быть заменена на линейную функцию от координат случайного вектора. Эта замена проводится с точностью до бесконечно малых более высокого порядка. Конечно, должны быть выполнены некоторые математические условия регулярности. Например, функции fn должны быть дважды непрерывно дифференцируемы в окрестности точки а.

Если вектор Xn является асимптотически нормальным с математическим ожиданием а и ковариационной матрицей ∑/ n, где ∑ = ||σ ij ||, причем σ ij = nM (Xi – ai)(Xj – aj), то линейная функция от его координат также асимптотически нормальна. Следовательно, при очевидных условиях регулярности fn (Xn) – асимптотически нормальная случайная величина с математическим ожиданием fn (а) и дисперсией

.

Для практического использования асимптотической нормальности fn (Xn) остается заменить неизвестные моменты а и ∑ на их оценки. Например, если Xn – это среднее арифметическое независимых одинаково распределенных случайных векторов, то а можно заменить на Xn, а ∑ - на выборочную ковариационную матрицу.

Пример. Пусть Y 1, Y 2, …, Yn – независимые одинаково распределенные случайные величины с математическим ожиданием а и дисперсией σ2. В качестве Xn (k = 1) рассмотрим выборочное среднее арифметическое

.

Как известно, в силу закона больших чисел а = М (У). Следовательно, для получения распределений функций от выборочного среднего арифметического можно использовать метод линеаризации. В качестве примера рассмотрим fn (y) = f (y) = y 2. Тогда

.

Из этого соотношения следует, что с точностью до бесконечно малых более высокого порядка

.

Поскольку в соответствии с Центральной Предельной Теоремой выборочное среднее арифметическое является асимптотически нормальной случайной величиной с математическим ожиданием а и дисперсией σ2/ n, то квадрат этой статистики является асимптотически нормальной случайной величиной с математическим ожиданием а 2 и дисперсией 4 а 2σ2/ n. Для практического использования может оказаться полезной замена параметров (асимптотического нормального распределения) на их оценки, а именно, математического ожидания – на , а дисперсии – на , где s2 – выборочная дисперсия.

Большое внимание (целая глава!) уделено методу линеаризации в классическом учебнике Е.С. Вентцель [7].

 

П-5. Принцип инвариантности

Пусть Y 1, Y 2, …, Yn – независимые одинаково распределенные случайные величины с непрерывной функцией распределения F (x). Многие используемые в прикладной статистике функции от результатов наблюдений выражаются через эмпирическую функцию распределения Fn (x), при каждом x равную доле наблюдений, не превосходящих x. К ним относятся статистики Колмогорова, Смирнова, омега-квадрат, обсуждаемые в главе 2. Отметим, что и другие статистики выражаются через эмпирическую функцию распределения, например:

.

Полезным является преобразование Н.В.Смирнова t = F (x). Тогда независимые случайные величины Zj = F (Yj), j = 1, 2, …, n, имеют равномерное распределение на отрезке [0; 1]. Рассмотрим построенную по ним эмпирическую функцию распределения Fn (t), 0 < t < 1. Эмпирическим процессом называется случайный процесс

.

Рассмотрим критерии проверки согласия функции распределения выборки с фиксированной функцией распределения F (x). Статистика критерия Колмогорова записывается в виде

статистика критерия Смирнова – это

а статистика критерия омега-квадрат (известного также как критерий Крамера - Мизеса - Смирнова) имеет вид

.

Случайный процесс ξ n (t) имеет нулевое математическое ожидание и ковариационную функцию М ξ n (sn (t) = min (s,t) – st. Рассмотрим гауссовский случайный процесс ξ(t) с такими же математическим ожиданием и ковариационной функцией. Он называется броуновским мостом. (Напомним, что гауссовским процесс именуется потому, что вектор (ξ(t 1), ξ(t 2), …, ξ(tk)) имеет многомерное нормальное распределение при любых наборах моментов времени t 1, t 2, …, tk.)

Пусть f – функционал, определенный на множестве возможных траекторий случайных процессов. Принцип инвариантности [1] состоит в том, что последовательность распределений случайных величин fn) сходится при n → ∞ к распределению случайной величины f (ξ). Сходимость по распределению обозначим символом =>. Тогда принцип инвариантности кратко записывается так: fn) => f (ξ). В частности, согласно принципу инвариантности статистика Колмогорова и статистика омега квадрат сходятся по распределению к распределениям соответствующих функционалов от случайного процесса ξ:

=> , => .

Таким образом, от проблем прикладной статистики сделан переход к теории случайных процессов. Методами этой теории найдены распределения случайных величин

, ,

т.е. предельные распределения статистик Колмогорова и омега-квадрат, а также и многих иных. Следовательно, принцип инвариантности – инструмент получения предельных распределений функций от результатов наблюдений, используемых в прикладной статистике.

Обоснование принципу инвариантности может быть дано на основе теории сходимости вероятностных мер в функциональных пространствах [8]. Более простой подход, позволяющий к тому же получать необходимые и достаточные условия в предельной теории статистик интегрального типа (принцип инвариантности к ним нельзя применить), рассмотрен в главе 2.

Почему «принцип инвариантности» так назван? Обратим внимание, что предельные распределения рассматриваемых статистик не зависят от их функции распределения F (x). Другими словами, предельное распределение инвариантно относительно выбора F (x).

В более широком смысле термин «принцип инвариантности» применяют тогда, когда предельное распределение не зависит от тех или иных характеристик исходных распределений [1]. В этом смысле наиболее известный «принцип инвариантности» - это Центральная Предельная Теорема, поскольку предельное стандартное нормальное распределение – одно и то же для всех возможных распределений независимых одинаково распределенных слагаемых (лишь бы слагаемые имели конечные математическое ожидание и дисперсию).

 

Литература

 

1. Вероятность и математическая статистика: Энциклопедия / Гл. ред. Ю.В.Прохоров. – М.: Большая Российская энциклопедия, 1999. – 910с.

2. Гнеденко Б.В. Курс теории вероятностей: Учебник. 7-е изд., исправл. - М.: Эдиториал УРСС, 2001. 320 с.

3. Рао С.Р. Линейные статистические методы и их применения. – М.: Наука, 1968. 548 с.

4. Келли Дж. Общая топология. - М.: Наука, 1968. - 384 с.

5. Орлов А.И. Устойчивость в социально-экономических моделях. - М.: Наука, 1979. - 296 с.

6. Орлов А.И. Асимптотическое поведение статистик интегрального типа. – В сб.: Вероятностные процессы и их приложения. Межвузовский сборник. - М.: МИЭМ, 1989. С.118-123.

7. Вентцель Е.С. Теория вероятностей. – М.: Наука, 1964.- 576 с.

8. Биллингсли П. Сходимость вероятностных мер. – М.: Наука, 1977. - 352 с.

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2019-06-26 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: