Интервальные оценки. Доверительный интервал и доверительная вероятность

ТЕМА ПРИНЦИПЫСТАТИСТИЧЕСКОГО ОЦЕНИВАНИЯ.

Вопросы:1. Классификация оценок

Интервальные оценки. Доверительный интервал и доверительная вероятность.

Распределение хи-квадрат

Распределение Стьюдента

Распределение Фишера

Классификация оценок

Квантиль - значение, которое заданная случайная величина не превышает с фиксированной вероятностью.

Интервальные оценки. Доверительный интервал и доверительная вероятность

В ряде задач требуется не только найти для параметра подходящее численное значение, но и оценить его точность и надежность. Требуется знать - к каким ошибкам может привести замена параметра его точечной оценкой и с какой степенью уверенности можно ожидать, что эти ошибки не выйдут за известные пределы?

Такого рода задачи особенно актуальны при малом числе наблюдений, когда точечная оценка в значительной мере случайна и приближенная замена на может привести к серьезным ошибкам.

Чтобы дать представление о точности и надежности оценки , в математической статистике пользуются так называемыми доверительными интервалами и доверительными вероятностями.

Пусть для параметра получена из опыта несмещенная оценка . Мы хотим оценить возможную при этом ошибку. Назначим некоторую достаточно большую вероятность (например, или ) такую, что событие с вероятностью можно считать практически достоверным, и найдем такое значение , для которого

(1)

Тогда диапазон практически возможных значений ошибки, возникающей при замене на θ ̃, будет ; большие по абсолютной величине ошибки будут появляться только с малой вероятностью

Перепишем (1) в виде:

. (2)

Равенство (2) означает, что с вероятностью неизвестное значение параметра попадает в интервал

(3)

При этом необходимо отметить одно обстоятельство. Ранее мы неоднократно рассматривали вероятность попадания случайной величины в заданный неслучайный интервал. Здесь дело обстоит иначе: величина не случайна, зато случаен интервал . Случайно его положение на оси абсцисс, определяемое его центром ; случайна вообще и длина интервала , так как величина вычисляется, как правило, по опытным данным. Поэтому в данном случае лучше будет толковать величину не как вероятность «попадания» точки в интервал , а как вероятность того, что случайный интервал накроет точку (рисунок).

Рис.

Вероятность принято называть доверительной вероятностью, а интервал - доверительным интервалом. Границы интервала : и называются доверительными границами.

Перейдем к вопросу о нахождении доверительных границ и .

Пусть для параметра имеется несмещенная оценка . Если бы нам был известен закон распределения величины , задача нахождения доверительного интервала была бы весьма проста: достаточно было бы найти такое значение , для которого

Затруднение состоит в том, что закон распределения оценки зависит от закона распределения величины и, следовательно, от его неизвестных параметров (в частности, и от самого параметра ).

Чтобы обойти это затруднение, можно применить следующий грубо приближенный прием: заменить в выражении для неизвестные параметры их точечными оценками. При сравнительно большом числе опытов (порядка ) этот прием обычно дает удовлетворительные по точности результаты.

В качестве примера рассмотрим задачу о доверительном интервале для математического ожидания.

Пусть произведено независимых опытов над случайной величиной , характеристики которой -математическое ожидание и дисперсия - неизвестны. Для этих параметров получены оценки:

; . (4)

Требуется построить доверительный интервал , соответствующий доверительной вероятности , дляматематического ожидания величины .

При решении этой задачи воспользуемся тем, что величина представляет собой сумму независимых одинаково распределенных случайных величин , и, согласно центральной предельной теореме, при достаточно большом ее закон распределения близок к нормальному. На практике даже при относительно небольшом числе слагаемых (порядка ) закон распределения суммы можно приближенно считать нормальным. Будем исходить из того, что величина распределена по нормальному закону. Характеристики этого закона - математическое ожидание идисперсия - равны соответственно и . Предположим, что величина нам известна, и найдём такую величину для которой

.вероятность (5)

Применяя формулу (5), выразим в левой части (5) через нормальную функцию распределения

. (6)

где - среднее квадратическое отклонение оценки .

Из уравнения

находим значение :

, (7)

где - функция, обратная , т. е. такое значение аргумента, при котором нормальнаяфункция распределения равна .

Дисперсия , через которую выражена величина , нам в точности не известна; в качестве ее ориентировочного значения можно воспользоваться оценкой (4) и положить приближенно:

. (8)

Таким образом, приближенно решена задача построения доверительного интервала, который равен:

, (9)

где определяется формулой (7).

Чтобы избежать при вычислении обратного интерполирования в таблицах функции , удобно составить специальную таблицу (см. табл. 1), где приводятся значения величины

в зависимости от . Величина определяет для нормального закона число средних квадратических отклонений, которое нужно отложить вправо и влево от центра рассеивания для того, чтобы вероятность попадания в полученный участок была равна .

Через величину доверительный интервал выражается в виде:

Интервальные оценки. Доверительный интервал и доверительная вероятность

Поиск по сайту