В этом случае рассматриваются две нормально распределенные генеральные совокупности и с параметрами , и , соответственно. Из первой совокупности извлекается выборка объема , из второй – объема . Требуется с заданной доверительной вероятностью построить доверительный интервал для разности математических ожиданий .
Рассмотрим случай, когда дисперсии и известны. Тогда случайная величина – среднее арифметическое для выборки из первой генеральной совокупности имеет нормальное распределение с параметрами . Случайная величина среднее арифметическое для выборки из генеральной совокупности имеет нормальное распределение с параметрами . Случайная величина – разность выборочных средних – имеет нормальное распределение (как разность нормально распределенных случайных величин) с параметрами
.Теперь можно заключить случайную величину в интервал
, где , и найти число , пользуясь таблицей функции Лапласа (прил. 2), из условия
. Тогда интервал для разности таков:
.
Если значения и неизвестны, но объемы выборок достаточно велики ( ), то также пользуются описанной процедурой, подставляя вместо и исправленные выборочные дисперсии и , определенные по выборкам.
40.
43. Проверка гипотезы о равенстве дисперсий двух нормальных генеральных совокупностей
Рассмотрим две случайные величины Х и У, каждая из которых подчиняется нормальному закону с дисперсиями . Пусть из этих генеральных совокупностей извлечены две выборки объёмами п1 и п2. Проверим гипотезу Н0 о том, что относительно альтернативной гипотезы Н1, заключающейся в том, что
Однако, мы располагаем только выборочными дисперсиями = и = . Задача проверки гипотезы Н0 сводится к сравнению выборочных дисперсий.
|
Для построения критической области с выбранной надёжностью необходимо исследовать совместный закон распределения оценок и . Таким законом распределения является распределение Фишера – Снедекора (или F - распределение)
Рассмотрим случайную величину , распределённую нормально с математическим ожиданием Х и с дисперсией . Произведём две независимые выборки объёмами п1 и п2. Для оценки используют выборочные дисперсии. Случайную величину, определяемую отношением , называют величиной с распределением Фишера-Снедекора. Имеются таблицы для дифференциального закона распределения Фишера-Снедекора, которые зависят лишь от объёма выборки и уровня значимости
, где k1 = n1 -1, k2 = n2 -1.
Вернёмся снова к задаче проверки гипотезы о равенстве дисперсий. Сначала нужно вычислить выборочные дисперсии. Найдём отношение F= , причём в числителе поставим большую из двух оценок дисперсии. Выберем уровень значимости и из таблиц находим число F которое сравнивается с вычисленным F. Если окажется, что , то проверяема гипотеза Н0 отвергается, в противном случае делается вывод о том, что наблюдения не противоречат проверяемой гипотезе.
44. Проверяется гипотеза вида . При неизвестных, но равных дисперсиях. При неравных объемах выборок статистика критерия имеет вид
, где , , , , или
. В случае нормального закона эта статистика в случае справедливости должна подчиняться распределению Стьюдента с числом степеней свободы , то есть .
|
При равных объемах выборок статистика принимает вид
= , а .
45. Проверяется гипотеза вида . При известных дисперсиях. Применение критерия сравнения двух выборочных средних при известных и равных дисперсиях предусматривает вычисление статистики
, где , - объем -й выборки, В случае принадлежности наблюдений нормальным законам статистика подчиняется стандартному нормальному закону.
46. Критерий согласия .
Существует несколько критериев согласия для проверки законов распределения случайной величины. Это критерии Колмогорова, Смирнова, Пирсона и др. Мы остановимся лишь на критерии Пирсона – это наиболее часто употребляемый критерий для проверки закона распределения случайной величины. Сначала нужно разбить всю область изменения случайной величины на l интервалов (бин). Затем нужно подсчитать сколько этих величин попадает в каждый бин, то есть подсчитать эмпирические частоты тк. Чтобы вычислить теоретические частоты нужно вероятность попадания в каждый бин рк умножить на объём выборки п. Таким образом, статистика
является случайной величиной, подчиняющейся закону с степенями свободы.В последней формуле r – число параметров распределния, определяемы по выборке. Для нормального закона – это два параметра, для закона Пуассона – один и т.д.
Рассчитав значения и выбрав уровень значимости , по таблице -распределения определяют . Если , то гипотезу Н0 отвергают, если то гипотезу принимают.
47. Регрессио́нный (линейный) анализ — статистический метод исследования влияния одной или нескольких независимых переменных на зависимую переменную . Независимые переменные иначе называют регрессорами или предикторами, а зависимые переменные — критериальными. На практике линия регрессии чаще всего ищется в виде линейной функции (линейная регрессия), наилучшим образом приближающей искомую кривую. Делается это с помощью метода наименьших квадратов, когда минимизируется сумма квадратов отклонений реально наблюдаемых от их оценок (имеются в виду оценки с помощью прямой линии, претендующей на то, чтобы представлять искомую регрессионную зависимость):
|
(M — объём выборки). Этот подход основан на том известном факте, что фигурирующая в приведённом выражении сумма принимает минимальное значение именно для того случая, когда .
Для решения задачи регрессионного анализа методом наименьших квадратов вводится понятие функции невязки:
Условие минимума функции невязки:
Полученная система является системой линейных уравнений с неизвестными
Если представить свободные члены левой части уравнений матрицей а коэффициенты при неизвестных в правой части матрицей
то получаем матричное уравнение: , которое легко решается методом Гаусса. Полученная матрица будет матрицей, содержащей коэффициенты уравнения линии регрессии: Для получения наилучших оценок необходимо выполнение предпосылок МНК.