Свойства функции распределения




 

Любая функция распределения обладает следующими свойствами:

Она не убывает: если , то ;

Существуют пределы и ;

Она в любой точке непрерывна слева:

 


 

Доказательство свойства (1). Для любых чисел событие влечёт событие , т.е. . Но вероятность - монотонная функция событий, поэтому

 

 

Для доказательства остальных свойств нам понадобится свойство непрерывности вероятностной меры.

Доказательство свойства (2). Заметим сначала, что существование пределов в свойствах (2), (3) вытекает из монотонности и ограниченности функции . Остается лишь доказать равенства

 

, и .

 

Для этого в каждом случае достаточно найти предел по какой-нибудь подпоследовательности , так как существование предела влечёт совпадение всех частичных пределов.

Докажем, что при . Рассмотрим вложенную убывающую последовательность событий :

 

 

Пересечение всех этих событий состоит из тех и только тех , для которых меньше любого вещественного числа. Но для любого элементарного исхода значение вещественно, и не может быть меньше всех вещественных чисел. Иначе говоря, пересечение событий не содержит элементарных исходов, т.е. . По свойству непрерывности меры, при .

Точно так же докажем остальные свойства.

Покажем, что при , т.е. . Обозначим через событие . События вложены:

 

 

а пересечение этих событий снова пусто - оно означает, что больше любого вещественного числа. По свойству непрерывности меры,

 

при .

 

Доказательство свойства (3). Достаточно доказать, что

 

 

при . Иначе говоря, доказать сходимость к нулю следующей разности:

вероятность распределение регрессионный анализ

 

Регрессионный анализ

 

Регрессионный анализ - метод моделирования измеряемых данных и исследования их свойств. Данные состоят из пар значений зависимой переменной (переменной отклика) и независимой переменной (объясняющей переменной). Регрессионная модель есть функция независимой переменной и параметров с добавленной случайной переменной. Параметры модели настраиваются таким образом, что модель наилучшим образом приближает данные. Критерием качества приближения (целевой функцией) обычно является среднеквадратичная ошибка: сумма квадратов разности значений модели и зависимой переменной для всех значений независимой переменной в качестве аргумента. Регрессионный анализ - раздел математической статистики и машинного обучения. Предполагается, что зависимая переменная есть сумма значений некоторой модели и случайной величины. Относительно характера распределения этой величины делаются предположения, называемые гипотезой порождения данных. Для подтверждения или опровержения этой гипотезы выполняются статистические тесты, называемые анализом остатков. При этом предполагается, что независимая переменная не содержит ошибок. Регрессионный анализ используется для прогноза, анализа временных рядов, тестирования гипотез и выявления скрытых взаимосвязей в данных.

Регрессия - зависимость математического ожидания (например, среднего значения) случайной величины от одной или нескольких других случайных величин (свободных переменных), то есть . Регрессионным анализом называется поиск такой функции f, которая описывает эту зависимость. Регрессия может быть представлена в виде суммы неслучайной и случайной составляющих.

 

 

где f - функция регрессионной зависимости, а v - аддитивная случайная величина с нулевым матожиданием. Предположение о характере распределения этой величины называется гипотезой порождения данных. Обычно предполагается, что величина v имеет гауссово распределение с нулевым средним и дисперсией .

Задача нахождения регрессионной модели нескольких свободных переменных ставится следующим образом. Задана выборка - множество значений свободных переменных и множество соответствующих им значений зависимой переменной. Эти множества обозначаются как D, множество исходных данных . Задана регрессионная модель - параметрическое семейство функций f(w,x) зависящая от параметров и свободных переменных x. Требуется найти наиболее вероятные параметры :

 

 

Функция вероятности p зависит от гипотезы порождения данных и задается Байесовским выводом или методом наибольшего правдоподобия.

Линейная регрессия предполагает, что функция f зависит от параметров w линейно. При этом линейная зависимость от свободной переменной x необязательна,

 

 

В случае, когда функция линейная регрессия имеет вид

 

 

здесь - компоненты вектора x.

Значения параметров в случае линейной регрессии находят с помощью метода наименьших квадратов. Использование этого метода обосновано предположением о гауссовском распределении случайной переменной.

Разности между фактическими значениями зависимой переменной и восстановленными называются регрессионными остатками (residuals). В литературе используются также синонимы: невязки и ошибки. Одной из важных оценок критерия качества полученной зависимости является сумма квадратов остатков:

 

 

Здесь SSE - Sum of Squared Errors.

Дисперсия остатков вычисляется по формуле

 

 

Здесь MSE - Mean Square Error, среднеквадратичная ошибка.

Нелинейные регрессионные модели - модели вида , которые не могут быть представлены в виде скалярного произведения

 

 

Где - параметры регрессионной модели, x - свободная переменная из пространства Rn, y - зависимая переменная, v - случайная величина и - функция из некоторого заданного множества.


 

Задача

По двум независимым выборкам объемом n1=30 и n2=15, извлеченным из нормальных генеральных совокупностей, найдены выборочные средние =25 и =27. Дисперсии генеральных совокупностей известны =1,3 и =1,6. На уровне значимости =0,1 проверить гипотезу Н0: μ1= μ2 при конкурирующей гипотезе Н1: μ1 μ2.

Решение

Найдем отношение большой исправленной дисперсии к меньшей Fнабл=1.6/1.3=1.23.

По условию конкурирующая гипотеза имеет вид μ1 μ2 поэтому критическая область - двусторонняя. В соответствии с правилом 2 при отыскании критической точки следует брать уровень значимости вдвое меньше заданного.

По таблице приложения 7, по уровню значимости a/2=0.1/2=0.05 и числом степеней свободы k1=15-1=14 и k2=30-1=29, находим критическую точку Fкр(0,05;14;29)=2,38.

Так как Fнабл>Fкр - нулевую гипотезу о равенстве генеральных дисперсий отвергаем.


Список используемой литературы

 

1. Ахтямов А.М. <https://ru.wikipedia.org/wiki/%D0%90%D1%85%D1%82%D1%8F%D0%BC%D0%BE%D0%B2,_%D0%90%D0%B7%D0%B0%D0%BC%D0%B0%D1%82_%D0%9C%D1%83%D1%85%D1%82%D0%B0%D1%80%D0%BE%D0%B2%D0%B8%D1%87> «Теория вероятностей». - М.: Физматлит, 2009.

. Булдык Г.М. «Теория вероятностей и математическая статистика», Мн., Высш. шк., 1989.

. Гнеденко Б.В. «Курс теории вероятностей», УРСС. М.: 2001.

. Мацкевич И.П., Свирид Г.П. «Высшая математика. Теория вероятностей и математическая статистика», Мн.: Выш. шк., 1993.

. Севастьянов Б.А. «Курс теории вероятностей и математической статистики», - М.: Наука, 1982.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2020-04-01 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: