Перед тем как приступить к решению второй половины третьей задачи, следует изучить такие понятия, как: выборка, случайные числа; случайные числа распределенные по определенному закону; эмпирические (экспериментальные) ряд и функция распределения; оценки параметров распределения; метод жребия моделирования дискретной величины; критерии Пирсона оценки достоверности гипотезы; доверительные вероятности и интервалы. Следует разобрать примеры 5.10, 5.11.
Коротко рассмотрим, в чем заключается метод жребия моделирования дискретной случайной величины. Пусть событие А может произойти с вероятностью р, и пусть очередное значение случайного числа – ri (случайное число – значение непрерывной случайной величины, равномерно распределенной в интервале [0,1]). Если ri £ р, то оно принадлежит интервалу , поэтому считаем, что событие А наступило. Если ri > р, то считается, что событие А не наступило.
Поскольку значения случайной величины ни что иное как случайные события, процедура моделирования дискретной случайной величины с заданным законом распределения аналогична моделированию случайного события.
Пусть дискретная случайная величина задана теоретическим рядом распределения.
h | х 1 | х 2 | х 3 | … | хn |
pi | р (х 1) | р (х 2) | р (х 3) | … | р (хn) |
Присваиваем случайной величине h значение х 1, если значение случайного числа ri £ p (х 1), значение х 2, если p (х 1)< ri £ p (х 1)+ p (х 2), т.е. в общем случае, если , то случайной величине h присваивается значение хm .
Пример 5.10. Дискретная случайная величина задана рядом распределения, приведенным в табл. 5.3.
Таблица 5.3
хi | ||||
pi | 0.6189 | 0.0896 | 0.2547 | 0.0368 |
1. Построить модель этой случайной величины для партии из 25 приборов (методом жребия получить её 25 значений); найти экспериментальные ряд и функцию распределения, построить их графики.
|
2. Найти оценки математического ожидания, дисперсии и среднего квадратического отклонения.
3. С помощью критерия Пирсона оценить соответствие экспериментального распределения теоретическому при уровнях значимости a1=0.01, a2= 0.05.
Решение. 1. Приступим к построению модели данной случайной величины. Этот процесс будем осуществлять методом жребия с помощью случайных чисел rj, т.е. значений случайной величины равномерно распределенной в интервале . Эти значения приведены в табл.Д Приложения. Моделируемые значения случайной величины обозначим Zj (j = 1, 2, …, 25). Заметим, что каждое из них следует рассматривать как случайную величину.
Для рассматриваемой случайной величины правило моделирования заключается в том, чтобы определить какое значение будет принимать случайная величина в зависимости от попадания случайного числа в интервал.
h примет значение:
0, если rj £ 0.6189,
5, если 0.6189 £ r j <0.7085,
10, если 0.7085 £ rj < 0.9631,
15, если ri >= 0.9631.
Для удобства использования правило можно свести в табл. 5.4 или изобразить на рис. 5.7.
Таблица 5. 4
Интервал | zj | |
0;0.619 | ||
0.619; 0.708 | ||
0.708; 0.963 | ||
0.963; 1.000 |
Z =0 Z =5 Z =10 Z =15
|
Замечание. Поскольку в табл. 5.4 даны только 2 знака мантиссы, значения границ интервалов округлили до трех знаков после запятой.
Приступая к моделированию h, возьмем первое число из табл. Д Приложения. Для того, чтобы начало было случайным, воспользуемся днем рождения решающего задачу. Допустим, он родился 9 марта. Поэтому начнем с 9-й строки 3-го столбца. Это число 67, следовательно, r 1 = 0.67, оно принадлежит второму интервалу , поэтому х 1 = 5. Таким образом, найдена стоимость ремонта первого прибора. Аналогично моделируются стоимости остальных приборов. Далее случайные числа будем выбирать двигаясь, например, по строкам влево или вправо. Второе число 43, т.е. r 2 = 0.43, оно из интервала , поэтому х 2=0. Сведем процесс нахождения реализаций h в табл. 5.5.
|
Таблица 5.5
j | rj | zj | j | rj | zj |
0.67 | 0.35 | ||||
0.43 | 0.98 | ||||
0.97 | 0.95 | ||||
0.04 | 0.11 | ||||
0.43 | 0.68 | ||||
0.62 | 0.77 | ||||
0.76 | 0.12 | ||||
0.59 | 0.17 | ||||
0.63 | 0.17 | ||||
0.57 | 0.68 | ||||
0.33 | 0.33 | ||||
0.21 | 0.73 | ||||
0.79 |
Найдем экспериментальный ряд распределения, для чего подсчитаем частоты mi, равные числу приборов с данной стоимостью ремонта, т.е. числу появлений значений хj, вычислим их относительные частоты, т.е. оценки вероятностей р = , и занесем результаты в табл. 5.6.
Таблица 5.6
xi | S | ||||
mi | |||||
р | 0.52 | 0.20 | 0.20 | 0.08 | 1.00 |
Найдем экспериментальную функцию распределения F *(х)= :
F *(х)= .
Построим экспериментальные многоугольник распределения и функцию распределения (рис. 5.8). Для наглядности сравнения теоретической и экспериментальной кривых построим штриховыми линиями теоретические кривые.
|
Рис. 5.8
2. Найдем оценки числовых характеристик. Для вычисления оценок математического ожидания, дисперсии и среднего квадратического отклонения воспользуемся формулами:
, (5.8)
где k – число различных значений случайной величины;
(5.9)
или
. (5.10)
Поскольку формулы (5.9) и (5.10) дают смещенную оценку дисперсии, несмещенную оценку найдем по формуле
. (5.11)
Замечание. При больших значениях n коэффициент очень близок к единице, и можно считать оценку, вычисленную по формулам (5.9) или (5.10), оценкой несмещенной дисперсии.
Вычисления запишем в табл. 5.7.
Таблица 5.7
xi | S | |||||
p | 0.52 | 0.20 | 0.20 | 0.08 | 1.00 | |
1.00 | 2.00 | 1.20 | 4.20 | = m * | ||
5.00 | 20.00 | 18.00 | 43.00 | |||
17.64 | ||||||
25.36 |
,
.
Сравнив полученные результаты с теоретическими (см. пример 5.5), видим, что экспериментальные характеристики отличаются от полученных из исходного ряда распределения. Для того чтобы получить более близкие результаты, следует существенно увеличить число реализаций случайной величины (например в два раза).
3. Проверим соответствие закона распределения полученной случайной величины F * (х) заданному закону распределения F (x), используя критерий Пирсона.
Для этого определяется случайная величина
,
где k – число значений случайной величины;
mi – число появлений значений случайной величины h;
pi – теоретическая вероятность значения;
n – объем моделируемой выборки (npi – ожидаемое число появлений значения хi при n реализациях случайной величины). Величина c2, называемая “хи-квадрат”, служит показателем того, насколько хорошо согласуются моделируемое и ожидаемое распределения.
В статистических расчетах число степеней свободы для дискретной случайной величины определяется как r = k – - 1, где k – число значений слу-чайной величины, – число параметров, которые были вычислены по результатам наблюдений.
Введем понятие «критическое значение» C = следующим образом:
если при проверяемой гипотезе вероятность события {χ2.> C } мала, Р (χ2.> С) = a, то С называется «критическим значением», а a – «уровнем значимости» критерия χ2. Уровень значимости является вероятностью отвергнуть правильную гипотезу. Выбор его определяется решаемой задачей. Как правило, полагают a = 0.01 или a = 0.05, т.е. в одном или пяти случаях из ста может быть отвергнута правильная гипотеза. Критические значения в зависимости от объема выборки и уровня значимости приведены в табл. С Приложения А.
В рассматриваемой задаче число k = 4, поэтому число степеней свободы
r = 4 - 1 = 3. По указанной таблице найдем критические числа С 1 (для a1 = 0.01) и С 2 (для a2 = 0.05): ими будут С 1 = 11,3 и С 2 = 7,8.
Найдем значение χ2. Все вычисления выполним в таблице 5.8 (n = 25, значение np i вычислим с точностью до одного знака после запятой).
Таблица 5.8
i | хi | mi | npi | mi- npi | |
15.5 | -2.5 | 0.403 | |||
2.2 | 2.8 | 3.536 | |||
6.4 | -1.4 | 0.306 | |||
0.9 | 1.1 | 1.344 | |||
S | - | 25.0 | 0.0 | 5.617= c 2 |
При уровне значимости a2 = 0.05 событие {χ2 > C 2} не произошло (5.617 < 7.8); полученное распределение не противоречит предполагаемому.
При менее жестких требованиях, т.е. при a = 0.01, событие { χ2> C 1} тем более не произошло, и в этом случае можно считать, что гипотеза о распределении случайной величины с заданным законом распределения не противоречит смоделированным значениям случайной величины.
Пример 5.11. Из выборки в 15 элементов нормальной генеральной совокупности найдены оценки математического ожидания = -1.5 и несмещенной дисперсии s 2= 1.21. Найти точность оценки математического ожидания и доверительный интервал, соответствующие доверительной вероятности b = 0.98.
Определить эти же величины для выборки в 40 элементов, если оценки оказались такими же.
Решение. Истинные математическое ожидание m и дисперсия 2 данного нормального распределения не известны, поэтому воспользуемся формулами e = t b и I b = (m *- e; m * + e) = ,
где e – предельная ошибка,
I b – доверительный интервал, соответствующий доверительной вероятности b,
t b – значения квантиля распределения Стьюдента для числа степеней свободы k = n -1.
В данной задаче число степеней свободы k = 14, а доверительная вероятность b = 0,98. По таблице А приложения значение квантилей распределения Стьюдента находится tb=2,62449. Тогда предельная ошибка e=2.62449 и доверительный интервал I 0.98 =(-1.5-0.75;-1.5+0.75) =
=(-2.25; -0.75). Полученный результат позволяет утверждать, что с вероятностью 0.98 математическое ожидание рассматриваемой случайной величины принадлежит интервалу (-2.25;-0.75).
При выборке 40 элементов в связи с тем, что с увеличением числа степеней свободы распределение Стьюдента быстро приближается к нормальному, воспользуемся формулами e zb для вычисления предельной ошибки оценки математического ожидания и I b = (m * - e; m * + e) =
= (m *- z b; m*+ z b) для вычисления доверительного интервала.
В этих формулах z b находится как корень уравнения Ф(z b) = по таблице значений нормированной функции распределения нормального закона (табл. В приложения). z b называется квантилью порядка нормированного нормального распределения.
Вычислив = = 0.99, входим с этим значением функции в табл.В Приложения и находим её аргумент, равный 2,327.
Таким образом, точность оценки e= , а доверительный интервал I 0.98 = (-1.5–0.405; -1.5+0.405) = (-1.905; -1.045).
Заметим, что увеличение объема выборки существенно сузило доверительный интервал.