Предварительный анализ статистических данных




Работа выполняется в Exce l

Исходные данные.

Заданы две выборки двух случайных величин Х1 и Х2, объемы выборок N1 и N2 соответственно.

Определение основных характеристик двух выборок.

Для каждой из выборок необходимо определить:

выборочное среднее Х1ср и Х2ср (воспользоваться функцией Excel СРЗНАЧ);

выборочное среднеквадратичное (стандартное) отклонение S1 и S2 (воспользоваться функцией Excel СТАНДОТКЛОН);

коэффициент вариации по формуле:

выборочную дисперсию S12 и S22;

 

определение доверительных интервалов для средних:

коэффициент Стьюдента t 1 (p1,β), t 2 (p2,β)

здесь р1 и р2 – число степеней свободы, в данном случае р1 = N1, р2 = N2,

β – доверительная вероятность, выбирается одно из трех значений:

β =0,8; β =0,9; β =0,95.

Для определения коэффициента Стьюдента воспользоваться функцией Excel СТЬЮДРАСПОБР.

Доверительные границы для средних:

нижние

верхние

 

Проверка крайних значений на принадлежность к выборкам.

Для каждой из выборок:

отбрасываем максимальные значения;

определяем основные характеристики выборок с отброшенными значениями

выборочные средние Х1ср’ и Х2ср’,

выборочные среднеквадратичные отклонения S1’ и S2’;

коэффициенты вариации:

коэффициенты Стьюдента t 1’ (p1’,β), t 2’ (p2’,β)

здесь р1’ = N1-1, р2’ = N2-1;

Доверительные границы для средних:

нижние

верхние

Если выполняются условия:

, а и ,

то гипотеза о непринадлежности крайнего значения к первой выборке отвергается и дальше выборка должна рассматриваться полностью; в противном случае гипотеза принимается и дальше выборка должна рассматриваться без крайнего значения.

То же для второй выборки.

Если выполняются условия:

, а и ,

то гипотеза о непринадлежности крайнего значения ко второй выборке отвергается и дальше выборка должна рассматриваться полностью; в противном случае гипотеза принимается и дальше выборка должна рассматриваться без крайнего значения.

Далее то же выполняется для минимальных значений, при этом, если принята гипотеза о непринадлежности максимальных значений к выборкам, исходные выборки рассматриваются без этих значений.

Проверка возможности объединения двух выборок.

Проверка гипотезы о равенстве двух дисперсий.

Эмпирический критерий Фишера:

, где - большее значение из двух S12 и S22, соответственно - меньшее значение. Если выполняется условие , то гипотеза о равенстве дисперсий может быть принята.

Здесь α – уровень значимости, выбирается одно из трех значений: α=0,1; α=0,05; α=0,01.

nб=Nб-1, nм=Nм-1, а Nб, Nм – объемы выборок, соответствующих большему и меньшему значению дисперсий.

- квантиль распределения Фишера, определяется с использованием функции Excel FРАСПОБР.

 

Проверка гипотезы о равенстве двух средних.

Эмпирический критерий Стьюдента:

,

где - стандартная ошибка разности средних значений:

Если выполняется условие , то гипотеза о равенстве средних значений может быть принята.

Здесь r=N1+N2-2 – число степеней свободы.

Если приняты обе гипотезы – о равенстве дисперсий и средних, то две выборки могут быть объединены. В этом случае определяются общие среднее значение и стандартное отклонение объединенной выборки.

 


Пример расчета.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2019-03-17 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: