Распределение хи-квадрат




Критерий - статистический критерий для проверки гипотезы , что наблюдаемая случайная величина подчиняется некому теоретическому закону распределения.

Карл Пи́рсон (англ. Karl (Carl) Pearson, 27 марта 1857, Лондон — 27 апреля 1936, там же) — английский математик, статистик, биолог и философ; основатель математической статистики, один из основоположников биометрики. В русскоязычных источниках его иногда называют Чарлз Пирсон

 

Распределение хи-квадрат

В зависимости от значения критерия , гипотеза может приниматься, либо отвергаться:

, гипотеза выполняется.

(попадает в левый "хвост" распределения). Следовательно, теоретические и практические значения очень близки. Если, к примеру, происходит проверка генератора случайных чисел, который сгенерировал n чисел из отрезка [0,1] и гипотеза : выборка распределена равномерно на [0,1], тогда генератор нельзя называть случайным (гипотеза случайности не выполняется), т.к. выборка распределена слишком равномерно, но гипотеза выполняется.

(попадает в правый "хвост" распределения) гипотеза отвергается.

Проверим гипотезу : если взять случайную выборку 100 человек из всего населения острова Кипр (генеральной совокупности), где количество мужчин и женщин примерно одинаково (встречаются с одинаковой частотой), то в наблюдаемой выборке отношение количества мужчин и женщин будет соотноситься с частотой как и во всей генеральной выборке(50/50). Пусть в наблюдаемой выборке 46 мужчин и 54 женщины, тогда число степеней свобод и

Т.о. при уровне значимости о выполнении гипотезы ничего сказать нельзя т.к. значение > (см. Таблицу распределения ).

Алгоритм применения критерия Пирсона для сопоставления эмпирического и теоретического (другого эмпирического) распределений одного признака

1. Занести в таблицу наименование разрядов и эмпирические частоты (данные по экспериментальной группе).

2. Во 2-й столбец записать теоретические частоты (данные по контрольной группе).

3. Проверить равенство сумм частот (или их уравнять).

4. Подсчитать разности между эмпирическими и теоретическими частотами (экспериментальной и контрольной группами) по каждой строке и записать их в 3-й столбец.

5. Возвести в квадрат полученные разности и записать их в 4-й столбец.

6. Разделить полученные квадраты разностей на теоретические частоты (данные по контрольной группе) и записать в 5-й столбец.

7. Просуммировать значения 5-го столбца, обозначив ее

8. Определить по таблице критическое значение для соответствующего уровня значимости и данного числа степеней свободы ( - количество разрядов признака, т.е. строк в таблице).

9. Если , то расхождения между распределениями существенны на данном уровне значимости.

Пример 1. При изучении творческой активности студентов были получены результаты для экспериментальных и контрольных групп. Определите, являются ли значимыми результаты предложенного подхода.

Уровень усвоения материала Частота эксп. группа. Частота контр.группы ' ( (
Хороший       9,63
Прибл.       3,44
Плохой       12,25
Сумма       25,32

7. .

8. для и и поскольку , то нулевая гипотеза опровергается на высоком уровне значимости. Это позволяет признать, что разница частот контрольного и экспериментального ряда является статистически достоверной.

Пример 2. В банке в течение двух дней проводилось исследование времени обслуживания клиентов, результаты которого следующие:

Номер интервала Время обслуживания (мин) Число клиентов в 1-й день Число клиентов во 2-й день
  4 - 6    
  6 - 8    
  8 - 10    
  10 - 12    
  12 - 14    
  14 - 16    
  16 - 18    

Можно ли считать одинаковыми среднее время обслуживания клиентов банка в первый и второй дни при alpha =0,05?

Решение. Вычислим



По таблице критических точек распределения по заданному уровню значимости и числу степеней свободы находим критическую точку .

Поскольку , то нет оснований отвергать нулевую гипотезу об одинаковом времени обслуживания клиентов банка в разные дни.

.

 

 

Распределение Стьюдента

Это однопараметрическое семейство абсолютно непрерывных распределений. Названо в честь Уильяма СилиГоссета, который первым опубликовал работы, посвящённые этому распределению, под псевдонимом «Стьюдент».

 

Распределение Стьюдента может быть использовано для получения доверительного интервала для ненаблюдаемой выборки из нормального распределения с неизвестным средним и дисперсией.

Предположим, что число A выбрано так

Тогда T обладает t-распределением с n –1 степенями свободы. По симметрии, это равноценно утверждению, что А удовлетворяет

или , тогда

что эквивалентно

таким образом, интервал с доверительным пределом в точках , это 90% доверительный интервал для μ. Следовательно, если мы находим среднее множества наблюдений (нормально распределенных), мы можем использовать распределение Стьюдента, чтобы определить, включают ли доверительные пределы по этому среднему какое-либо теоретически предсказанное значение, например, значение, предсказанное нулевой гипотезой.

Такой подход применяется в t-критерии Стьюдента: если разница между средними значениями выборок из двух нормальных распределений сама может быть нормально распределена, распределение Стьюдента может быть использовано для исследования того, может ли эта разница равняться нулю.

Для нормально распределенных выборок односторонний (1− a) верхний предел доверия (UCL) среднего значения равен

.

Полученный в результате верхний предел доверия будет наибольшим средним значением для данного доверительного интервала и размера выборки. Другими словами, если среднее значение множества наблюдений, вероятность того, что среднее значение распределения уступает равна уровню значимости 1– a.

 

Распределение Фишера

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-04-27 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: