Уровень значимости. Критическая область.

Тема: Понятие статистической гипотезы

Понятие,виды статистических гипотез.

Ошибки I и II рода. Критерий значимости.

Уровень значимости. Критическая область.

Общая схема проверки гипотез.

Понятие,виды статистических гипотез

Статистическая гипотеза – это предположение о виде

распределения или о величинах неизвестных параметров

генеральной совокупности, которая может быть проверена на

основании выборочных показателей. Генеральная совокупность распределена по закону Гаусса (нормальному закону). Дисперсии двух нормальных совокупностей равны между собой. Гипотеза «на Марсе есть жизнь» не является статистической, поскольку в ней не идет речь ни о виде, ни о параметрах распределения. Вместе с выдвинутой гипотезой рассматривают и противоречащую ей гипотезу. Если выдвинутая гипотеза будет отвергнута, то имеет место альтернативная ей гипотеза. Целесообразно их различать.

Нулевой (H0) называют выдвинутую гипотезу. Альтернативной (H1) – гипотезу, противоречащую нулевой.

Различают гипотезы, которые содержат только одно и более одного предположений. Гипотезу, содержащую только одно предположение называют простой, а гипотезу, которая состоит из конечного или бесконечного числа простых гипотез – сложной.

1. H0: математическое ожидание нормального распределения равно 3 (= 3, – известно) – это простая гипотеза;

2. H0: математическое ожидание нормального распределения меньше 3 (< 3, – известно) – сложная (она состоит из бесконечного множества простых вида Hi:=b i, где bi – любое число, меньшее 3).

Ошибки I и II рода. Критерий значимости.

Уровень значимости. Критическая область.

Решение об отклонении или принятии статистической гипотезы принимается по выборочным данным. Поэтому приходится считаться и с возможностью ошибочного решения.

Различают ошибки I и II рода.

Ошибка I рода состоит в том, что будет отвергнута правильная гипотеза (т.е. будет отвергнута нулевая гипотеза, в то время, когда она верна)

Ошибка II рода состоит в том, что будет принята неправильная гипотеза (т.е. будет принята нулевая гипотеза, в то время, когда она не верна) При отбрасывании нулевой гипотезы есть вероятность того, что она все-таки верна (т.е. мы совершаем ошибку I-го рода), эту вероятность обозначают . Вероятность называется уровнем значимости.

Уровень значимости – это вероятность совершить ошибку I рода. Вероятность ошибки II рода обозначают , а величину называют мощностью критерия.

Чем больше мощность, тем вероятность ошибки II рода меньше.

H0 принимается H1 принимается

H0 верна P(H0|H0) = 1 – P(H1|H0) = – уровень значимости

H1 верна P(H0|H1) = P(H1|H1) = 1–– мощность критерия

Допустимый процент возможных ошибок первого рода – вопрос взаимной договоренности, кроме всего прочего здесь должны приниматься во внимание возможные последствия принятия ошибочного решения. Ложные решения, например при экспертизе, могут иметь более серьезные последствия, чем ошибочно декларированная чистота химического реактива. Поэтому в первом случае должны быть предусмотрены более высокая достоверность и, следовательно, более низкое число возможных ошибок I рода, чем во втором случае.

Обычно придерживаются следующих правил.

Проверяемая гипотеза отбрасывается, если ошибка I рода может появиться в менее чем 100= 1% всех случаев (т.е. 0,01). Тогда рассматриваемое различие считается значимым.

Проверяемая гипотеза принимается, когда ошибка I рода возможна в более чем 100= 5% всех случаев (0,05). Тогда рассматриваемое различие считается незначимым. Рассматриваемую гипотезу надо обсуждать дальше, если число возможных ошибок I рода лежит в интервале между 5% и 1% (0,010,05). Обнаруженная разность интерпретируется как спорная. Часто дополнительные измерения могут прояснить ситуацию. Если по каким-либо причинам дополнительных

измерений окажется недостаточно, то полученные данные следует интерпретировать в расчете на самый неблагоприятный случай.

Выбор - дело договорное, иногда достаточно выбрать 100= 10%, в отдельных случаях, практически, должна быть исключена возможность ошибочного решения (например, при оценке токсического действия фармацевтического препарата).

Тогда проверяемая гипотеза отбрасывается, как только число возможных ошибок I рода достигает такого пренебрежительно малого уровня, как, например, 100= 0,1%. Ошибки I и II рода зависят друг от друга. Чем меньше будет , тем больше будет (и наоборот). Поэтому, нет никакого смысла для проверки значимости выбирать слишком малое значение , так как из-за этого очень вырастает неизвестное . Выбор относится к фазе планирования эксперимента! После того, как задались уровнем значимости, находят правило, в соответствии с которым принимается или отклоняется данная гипотеза. Такое правило называется статистическим критерием.

Статистический критерий– правило, в соответствии с

которым принимается или отклоняется нулевая гипотеза.

Построение критерия заключается в выборе подходящей

функции T = T(x 1,…, x n) от результатов наблюдений x 1,…, x n, которая

служит мерой расхождения между опытными и гипотетическими

значениями.

Эта функция, являющаяся случайной величиной, называется статистикой критерия.

Статистика критерия– специально выработанная

случайная величина, функция распределения которой известна.

При этом предполагается, что распределение вероятностей

T=T(x 1,…, x n) может быть вычислено при допущении, что

проверяемая гипотеза верна и что это распределение не зависит

от характеристик гипотетического распределения.

После выбора определенного критерия множество всех

возможных значений разбивают на два непересекающихся

подмножества: одно из них содержит значения критерия, при

которых нулевая гипотеза отвергается, а другая – при которых она

принимается, т.е. на критическую область и область принятия

гипотезы.

Критическая область – совокупность значений критерия, при которых нулевую гипотезу отвергают.

Область принятия гипотезы – совокупность значений критерия, при которых нулевую гипотезу принимают.

Основной принцип проверки гипотез можно сформулировать так: если наблюдаемое значение критерия принадлежит критической области – гипотезу отвергают, если наблюдаемое значение критерия принадлежит области принятия гипотезы – гипотезу принимают. Поскольку критерий T = T(x 1,…, x n) – одномерная случайная величина, все ее возможные значения принадлежат некоторому интервалу. Поэтому критическая область и область принятия гипотезы также являются интервалами, и, следовательно, существуют точки, которые их разделяют. Такие точки называются критическими.

Критические значения критерия – это точки, отделяющие критическую область от области принятия гипотезы.

Критическое значение Ткр находится по распределению статистики Т такое, что если гипотеза верна, то вероятность события (Tкритической области) равна,заранее заданный уровень значимости, т.е. это значение Tкр статистики Т для которого P(Tкритической области).

Различают односторонюю (правостороннюю или левостороннюю) и двустороннюю критическую области. Они определяются из следующих выражений: правосторонняя – P(T>Tкр) = ; левосторонняя – P(T<Tкр) = ; двусторонняя – P(T<Tкр1)+P(T>Tкр2) =Tкр1<Tкр2.Если распределение критерия симметрично относительно нуля, то P(T<–Tкр) = P(T>Tкр), отсюда получаем P(T>Tкр)= /2. Критические точки находят по таблицам, соответствующим распределению критерия.

Критерии значимости делят на параметрические и непараметрические. Первые строятся на основе параметров выборочной совокупности и представляют функции этих параметров, вторые – функции от вариант данной совокупности с

их частотами. Параметрические критерии применимы лишь в тех случаях, когда генеральная совокупность, из которой взята выборка, распределяется нормально. Непараметрические критерии применимы к распределениям самых различных форм.

Последние имеют определенные преимущества по сравнению с параметрическими, благодаря меньшим требованиям к их применению, большему диапазону возможностей и, часто, большей простоте реализации. Конечно, нужно считаться и с часто более низкой точностью этих критериев по сравнению с параметрическими. Результаты статистических методов проверки часто бывают неудобны для аналитиков. Во многих случаях они делают незначимые (0,05) или спорные различия, хотя на основе субъективного опыта уже установлено «истинное» различие. В подобных случаях часто помогают дополнительные измерения. Чем больше получено результатов, тем меньшие различия будут достоверно фиксироваться. Ни в коем случае нельзя соблазняться заменой точных данных сомнительными на основании

субъективной оценки.

Уровень значимости. Критическая область.

Поиск по сайту