Доверительный интервал.
Случайный интервал , границы которого
и
зависят от результатов наблюдений x1, x2,..., xn, который с заданной вероятность p содержит неизвестный параметр θ, называется доверительным интервалом для параметра θ, соответствующим доверительной вероятности p:
P =p,
где p – доверительная вероятность.
Заданной доверительной вероятности соответствует не единственный доверительный интервал. Интервалы меняются от выборки до выборки, а также зависят от метода его нахождения.
Чтобы судить о точности и надёжности оценки неизвестного параметра θ, рассматривают вероятность неравенства
;
P = p
P
=p.
Если вероятность p близка к 1, то оценка считается надёжной. Если , то оценка считается достаточно точной. Обычно значения δ и p зависят друг от друга.
И находят доверительный интервал из формулы:
P =
.
Доверительный интервал для мат ожидания.
Доверительным называется интервал, в который с заданной вероятностью
(надежностью) γ попадают значения параметра Q. Вероятность γ выбирается
близкой к 1: 0,9; 0,95; 0,975; 0,99.
Доверительный интервал надежностью γ для математического ожидания
нормально распределенной случайной величины X:
Доверительный интервал надежностью γ для дисперсии нормально распределенной случайной величины X:
62. Пусть задана случайная выборка — последовательность
объектов из множества
. Предполагается, что на множестве
существует некоторая неизвестная вероятностная мера
.
Методика состоит в следующем.
Формулируется нулевая гипотеза о распределении вероятностей на множестве
. Гипотеза формулируется исходя из требований прикладной задачи. Чаще всего рассматриваются две гипотезы — основная или нулевая
и альтернативная
. Иногда альтернатива не формулируется в явном виде; тогда предполагается, что
означает «не
». Иногда рассматривается сразу несколько альтернатив.
Задаётся некоторая статистика (функция выборки) , для которой в условиях справедливости гипотезы
выводится функция распределения
и/или плотность распределения
. Вопрос о том, какую статистику надо взять для проверки той или иной гипотезы, часто не имеет однозначного ответа. Вывод функции распределения
при заданных
и
Собственно статистический тест (статистический критерий) заключается в проверке условия:
если , то делается вывод «данные противоречат нулевой гипотезе при уровне значимости
». Гипотеза отвергается.
если , то делается вывод «данные не противоречат нулевой гипотезе при уровне значимости
». Гипотеза принимается.
Итак, статистический критерий определяется статистикой и критическим множеством которое зависит от уровня значимости.
63. Ошибка первого рода или «ложная тревога»— когда нулевая гипотеза отвергается, хотя на самом деле она верна. Вероятность ошибки первого рода:
Ошибка второго рода или «пропуск цели»— когда нулевая гипотеза принимается, хотя на самом деле она не верна. Вероятность ошибки второго рода:
Статистические критерии проверки гипотез разнообразны, но у них единая логическая схема построения критерия, которая укладывается в 5 шагов
1-й шаг. Выдвигается основная (или проверяемая) гипотеза Н0. Гипотеза Н1, которая противоречит основной Н0, называется альтернативной, или конкурирующей.
2-й шаг. Задается уровень значимости критерия . Величину называют уровнем значимости, размером критерия или ошибкой первого рода. Это вероятность отвергнуть основную гипотезу Н0 при условии, что она верна.
3-й шаг. Задается некоторая функция результатов наблюдения – критическая статистика
кр =
(х1, х2,..., хn).
Содержательный смысл критической статистики – мера расхождения имеющейся в распоряжении исследователя выборки с основной гипотезой Н0.
4-й шаг. Из статистических таблиц распределения W( кр) находятся квантили уровня /2 и 1-/2 или процентные точки
(1-/2)100% и
(/2)100%, являющиеся соответственно нижней
кр.н и верхней
кр.в критическими точками (границами). Они делят всю область допустимых значений
кр на области:
неправдоподобно малых (I);
правдоподобных (II);
неправдоподобно больших (III).
принятия гипотезы Н0 имеет два ограничения – сверху и снизу.
5-й шаг. Определяется наблюденное (расчетное) значение критической статистики расч подстановкой в
кр конкретных выборочных значений х1, х2,..., хn или некоторых функций от них. Если окажется, что
расч принадлежит области правдоподобных значений, то гипотеза Н0 верна, т.е. не противоречит выборочным данным. В противном случае Н0 отвергается с ошибкой первого рода . Отвержение Н0 означает, что
расч не подчиняется закону распределения W(
кр).
64. Пусть ξ нормально распределенная случайная величина с неизвестным математическим ожиданием a и неизвестной дисперсией, представленная выборочными значениями
x 1, x 2, …, xn .
Задача состоит в проверке гипотезы о том, что неизвестный параметр a равен заданному числу a 0.
Сформулируем нулевую гипотезу H 0 о том, что неизвестный параметр a равен заданному числу a 0, т.е. H 0: a=a 0.
Альтернативную гипотезу H 1 можно сформулировать тремя способами:
- H 1: a≠a 0;
- H 1: a>a 0;
- H 1: a<a 0.
По выборке вычислим значение критерия
, где
,
.
Критерий ϕ сконструирован так, что если гипотеза H 0 верна, то случайная величина ϕ имеет распределение Стьюдента с числом степеней свободы n –1.
65. Пусть (x) ξ нормально распределенная случайная величина с неизвестной дисперсией D (x) = σ2, представленная выборочными значениями
x 1, x 2, …, xn .
Задача состоит в проверке гипотезы о том, что неизвестный параметр σ2 равен заданному числу.
Пусть дана некоторая оценка неизвестной дисперсии
, построенная по выборке
x 1, x 2, …, xn .
Предположим, что истинное значение дисперсии равно .
Поскольку оценка — случайная величина, то выборочное значение
, вряд ли будет совпадать с
. В связи с этим возникает вопрос: при каком отклонении
от
и с какой степенью уверенности можно утверждать, что истинное значение дисперсии
отлично от
? Ответом на этот вопрос может быть значение вероятности того, что величина
, вычисленная в предположении, что
, больше некоторого фиксированного числа.
Если эта вероятность мала, то мы являемся свидетелями маловероятного события, т.е. отличие эмпирического значения от гипотетического значения
представляется значимым и гипотеза о том, что
должна быть отвергнута.
Если же эта вероятность велика, то отклонение от
, по-видимому, обусловлено естественной случайностью, и гипотеза
может быть принята.
66. Пусть x и h независимые нормально распределенные случайные величины, представленные выборочными значениями соответственно
x1, x2, …, xn и y1, y 2, …, y m.
Задача состоит в проверке гипотезы о том, что равны неизвестные математические ожидания M x = a x и Mh = a h. Значения дисперсий Dx = σx2 и Dh = σh2 известны.
Например, на двух предприятиях производятся одинаковые товары и среднее значение некоторого параметра в контрольной партии с одного предприятия отличается от значения того же параметра, полученного при обследовании второго предприятия.
Возникает вопрос: эти различия статистически значимы или нет?
Различия обусловлены только случайными факторами, или различием в организации производства на предприятиях?
Итак, проверяем гипотезу против альтернативы
.
Если гипотеза верна, то величина
подчинена стандартному нормальному распределению .
Здесь ,
и
.
67. Условия применения F-критерия: обе выборки независимы и получены из нормально распределенных генеральных совокупностей с параметрами и
.
Гипотеза H0: =
.
Альтернатива H1:
.
(Это двусторонняя гипотеза, поэтому следует применять двусторонний критерий. Если же предположить, что одна из генеральных совокупностей имеет| большую дисперсию (обозначим ее ), чем другая (
), то можно сформулировать одностороннюю гипотезу H1:
>
|, и тогда применяется односторонний F-критерий.)
Уровень значимости критерия задается .
Порядок применения F-критерия следующий:
1. Принимается предположение о нормальности распределения генеральных совокупностей, формулируется гипотеза и альтернатива, назначается уровень значимости , как указано выше.
2. Получают две независимые выборки из совокупностей X и Y объемом nх и nу соответственно.
3. Рассчитываются значения исправленных выборочных дисперсий и
. Большую из дисперсий (
или
) обозначают
, меньшую —
4. Вычисляется значение F-критерия по формуле:
5. Сравнивается вычисленное значение Fнабл с критическим значением Fкритич при заданном уровне значимости и числе степеней свободы 1 = n1–1 и 2 =n2–1.
(Критические значения F при уровнях значимости , равных 0,05, 0,01, 0,001 приведены в таблицах).
Отметим, что в обычно в таблице приведены критические значения одностороннего F-критерия. Поэтому если цель исследования доказать, что одна дисперсия больше другой (H1: ), то критические значения берутся непосредственно из этой таблицы. Если же применяется двусторонний критерий (H1:
), то критические значения, взятые из таблиц, соответствуют удвоенным уровням значимости: 0,01, 0,02 и 0,002.
6. Делается вывод: если вычисленное значение Fнабл- больше или равно критическому Fкритич, то дисперсии различаются значимо на заданном уровне значимости. К противном случае нет оснований для отклонения нулевой гипотезы о равенстве двух дисперсий.
Следует отметить, что F-критерий очень чувствителен к отклонениям от нормальности распределения генеральной совокупности. Если предположение о нормальном распределении не может быть принято, то F-критерий применять не следует. В этом случае используются непараметрические методы.
F-критерий используется для малых и средних объемов выборки (n < 100). Для больших объемов выборки (n > 100) при проверке гипотезы о равенстве дисперсий удобнее применять U-критерий. В этом случае вычисляется величина
71. Соотношения между социально-экономическими явлениями и процессами далеко не всегда можно выразить линейными функциями, так как при этом могут возникать неоправданно большие ошибки. В таких случаях используют нелинейную (по объясняющей переменной) регрессию. Наиболее
часто встречаются следующие виды уравнений нелинейной регрессии: полиномиальное ух = bo + b1x +... + bkxk гиперболическое Ух= bo + b1x степенное yx=b0*…*xp^bp