Перед тем как приступить к решению второй половины третьей задачи, следует изучить такие понятия, как: выборка, случайные числа; случайные числа распределенные по определенному закону; эмпирические (экспериментальные) ряд и функция распределения; оценки параметров распределения; метод жребия моделирования дискретной величины; критерии Пирсона оценки достоверности гипотезы; доверительные вероятности и интервалы. Следует разобрать примеры 5.10, 5.11.
Коротко рассмотрим, в чем заключается метод жребия моделирования дискретной случайной величины. Пусть событие А может произойти с вероятностью р, и пусть очередное значение случайного числа – ri (случайное число – значение непрерывной случайной величины, равномерно распределенной в интервале [0,1]). Если ri £ р, то оно принадлежит интервалу
, поэтому считаем, что событие А наступило. Если ri > р, то считается, что событие А не наступило.
Поскольку значения случайной величины ни что иное как случайные события, процедура моделирования дискретной случайной величины с заданным законом распределения аналогична моделированию случайного события.
Пусть дискретная случайная величина задана теоретическим рядом распределения.
| h | х 1 | х 2 | х 3 | … | хn |
| pi | р (х 1) | р (х 2) | р (х 3) | … | р (хn) |
Присваиваем случайной величине h значение х 1, если значение случайного числа ri £ p (х 1), значение х 2, если p (х 1)< ri £ p (х 1)+ p (х 2), т.е. в общем случае, если
, то случайной величине h присваивается значение хm .
Пример 5.10. Дискретная случайная величина задана рядом распределения, приведенным в табл. 5.3.
Таблица 5.3
| хi | ||||
| pi | 0.6189 | 0.0896 | 0.2547 | 0.0368 |
1. Построить модель этой случайной величины для партии из 25 приборов (методом жребия получить её 25 значений); найти экспериментальные ряд и функцию распределения, построить их графики.
2. Найти оценки математического ожидания, дисперсии и среднего квадратического отклонения.
3. С помощью критерия Пирсона оценить соответствие экспериментального распределения теоретическому при уровнях значимости a1=0.01, a2= 0.05.
Решение. 1. Приступим к построению модели данной случайной величины. Этот процесс будем осуществлять методом жребия с помощью случайных чисел rj, т.е. значений случайной величины равномерно распределенной в интервале
. Эти значения приведены в табл.Д Приложения. Моделируемые значения случайной величины обозначим Zj (j = 1, 2, …, 25). Заметим, что каждое из них следует рассматривать как случайную величину.
Для рассматриваемой случайной величины правило моделирования заключается в том, чтобы определить какое значение будет принимать случайная величина в зависимости от попадания случайного числа в интервал.
h примет значение:
0, если rj £ 0.6189,
5, если 0.6189 £ r j <0.7085,
10, если 0.7085 £ rj < 0.9631,
15, если ri >= 0.9631.
Для удобства использования правило можно свести в табл. 5.4 или изобразить на рис. 5.7.
Таблица 5. 4
| Интервал | zj | |
| 0;0.619 | ||
| 0.619; 0.708 | ||
| 0.708; 0.963 | ||
| 0.963; 1.000 |
Z =0 Z =5 Z =10 Z =15
|
Замечание. Поскольку в табл. 5.4 даны только 2 знака мантиссы, значения границ интервалов округлили до трех знаков после запятой.
Приступая к моделированию h, возьмем первое число из табл. Д Приложения. Для того, чтобы начало было случайным, воспользуемся днем рождения решающего задачу. Допустим, он родился 9 марта. Поэтому начнем с 9-й строки 3-го столбца. Это число 67, следовательно, r 1 = 0.67, оно принадлежит второму интервалу
, поэтому х 1 = 5. Таким образом, найдена стоимость ремонта первого прибора. Аналогично моделируются стоимости остальных приборов. Далее случайные числа будем выбирать двигаясь, например, по строкам влево или вправо. Второе число 43, т.е. r 2 = 0.43, оно из интервала
, поэтому х 2=0. Сведем процесс нахождения реализаций h в табл. 5.5.
Таблица 5.5
| j | rj | zj | j | rj | zj |
| 0.67 | 0.35 | ||||
| 0.43 | 0.98 | ||||
| 0.97 | 0.95 | ||||
| 0.04 | 0.11 | ||||
| 0.43 | 0.68 | ||||
| 0.62 | 0.77 | ||||
| 0.76 | 0.12 | ||||
| 0.59 | 0.17 | ||||
| 0.63 | 0.17 | ||||
| 0.57 | 0.68 | ||||
| 0.33 | 0.33 | ||||
| 0.21 | 0.73 | ||||
| 0.79 |
Найдем экспериментальный ряд распределения, для чего подсчитаем частоты mi, равные числу приборов с данной стоимостью ремонта, т.е. числу появлений значений хj, вычислим их относительные частоты, т.е. оценки вероятностей р
=
, и занесем результаты в табл. 5.6.
Таблица 5.6
| xi | S | ||||
| mi | |||||
р
| 0.52 | 0.20 | 0.20 | 0.08 | 1.00 |
Найдем экспериментальную функцию распределения F *(х)=
:
F *(х)=
.
Построим экспериментальные многоугольник распределения и функцию распределения (рис. 5.8). Для наглядности сравнения теоретической и экспериментальной кривых построим штриховыми линиями теоретические кривые.

Рис. 5.8
2. Найдем оценки числовых характеристик. Для вычисления оценок математического ожидания, дисперсии и среднего квадратического отклонения воспользуемся формулами:
, (5.8)
где k – число различных значений случайной величины;
(5.9)
или
. (5.10)
Поскольку формулы (5.9) и (5.10) дают смещенную оценку дисперсии, несмещенную оценку найдем по формуле
. (5.11)
Замечание. При больших значениях n коэффициент
очень близок к единице, и можно считать оценку, вычисленную по формулам (5.9) или (5.10), оценкой несмещенной дисперсии.
Вычисления запишем в табл. 5.7.
Таблица 5.7
| xi | S | |||||
p
| 0.52 | 0.20 | 0.20 | 0.08 | 1.00 | |
| 1.00 | 2.00 | 1.20 | 4.20 | = m * | |
| 5.00 | 20.00 | 18.00 | 43.00 |
| |
| 17.64 |
| |||||
| 25.36 |
|
,
.
Сравнив полученные результаты с теоретическими (см. пример 5.5), видим, что экспериментальные характеристики отличаются от полученных из исходного ряда распределения. Для того чтобы получить более близкие результаты, следует существенно увеличить число реализаций случайной величины (например в два раза).
3. Проверим соответствие закона распределения полученной случайной величины F * (х) заданному закону распределения F (x), используя критерий Пирсона.
Для этого определяется случайная величина
,
где k – число значений случайной величины;
mi – число появлений значений случайной величины h;
pi – теоретическая вероятность значения;
n – объем моделируемой выборки (npi – ожидаемое число появлений значения хi при n реализациях случайной величины). Величина c2, называемая “хи-квадрат”, служит показателем того, насколько хорошо согласуются моделируемое и ожидаемое распределения.
В статистических расчетах число степеней свободы для дискретной случайной величины определяется как r = k –
- 1, где k – число значений слу-чайной величины,
– число параметров, которые были вычислены по результатам наблюдений.
Введем понятие «критическое значение» C =
следующим образом:
если при проверяемой гипотезе вероятность события {χ2.> C } мала, Р (χ2.> С) = a, то С называется «критическим значением», а a – «уровнем значимости» критерия χ2. Уровень значимости является вероятностью отвергнуть правильную гипотезу. Выбор его определяется решаемой задачей. Как правило, полагают a = 0.01 или a = 0.05, т.е. в одном или пяти случаях из ста может быть отвергнута правильная гипотеза. Критические значения в зависимости от объема выборки и уровня значимости приведены в табл. С Приложения А.
В рассматриваемой задаче число k = 4, поэтому число степеней свободы
r = 4 - 1 = 3. По указанной таблице найдем критические числа С 1 (для a1 = 0.01) и С 2 (для a2 = 0.05): ими будут С 1 = 11,3 и С 2 = 7,8.
Найдем значение χ2. Все вычисления выполним в таблице 5.8 (n = 25, значение np i вычислим с точностью до одного знака после запятой).
Таблица 5.8
| i | хi | mi | npi | mi- npi |
|
| 15.5 | -2.5 | 0.403 | |||
| 2.2 | 2.8 | 3.536 | |||
| 6.4 | -1.4 | 0.306 | |||
| 0.9 | 1.1 | 1.344 | |||
| S | - | 25.0 | 0.0 | 5.617= c 2 |
При уровне значимости a2 = 0.05 событие {χ2 > C 2} не произошло (5.617 < 7.8); полученное распределение не противоречит предполагаемому.
При менее жестких требованиях, т.е. при a = 0.01, событие { χ2> C 1} тем более не произошло, и в этом случае можно считать, что гипотеза о распределении случайной величины с заданным законом распределения не противоречит смоделированным значениям случайной величины.
Пример 5.11. Из выборки в 15 элементов нормальной генеральной совокупности найдены оценки математического ожидания
= -1.5 и несмещенной дисперсии s 2= 1.21. Найти точность оценки математического ожидания и доверительный интервал, соответствующие доверительной вероятности b = 0.98.
Определить эти же величины для выборки в 40 элементов, если оценки оказались такими же.
Решение. Истинные математическое ожидание m и дисперсия
2 данного нормального распределения не известны, поэтому воспользуемся формулами
e = t b
и
I b = (m *- e; m * + e) =
,
где
e – предельная ошибка,
I b – доверительный интервал, соответствующий доверительной вероятности b,
t b – значения квантиля распределения Стьюдента для числа степеней свободы k = n -1.
В данной задаче число степеней свободы k = 14, а доверительная вероятность b = 0,98. По таблице А приложения значение квантилей распределения Стьюдента находится tb=2,62449. Тогда предельная ошибка e=2.62449
и доверительный интервал I 0.98 =(-1.5-0.75;-1.5+0.75) =
=(-2.25; -0.75). Полученный результат позволяет утверждать, что с вероятностью 0.98 математическое ожидание рассматриваемой случайной величины принадлежит интервалу (-2.25;-0.75).
При выборке 40 элементов в связи с тем, что с увеличением числа степеней свободы распределение Стьюдента быстро приближается к нормальному, воспользуемся формулами e
zb для вычисления предельной ошибки оценки математического ожидания и I b = (m * - e; m * + e) =
= (m *-
z b; m*+
z b) для вычисления доверительного интервала.
В этих формулах z b находится как корень уравнения Ф(z b) =
по таблице значений нормированной функции распределения нормального закона (табл. В приложения). z b называется квантилью порядка
нормированного нормального распределения.
Вычислив
=
= 0.99, входим с этим значением функции в табл.В Приложения и находим её аргумент, равный 2,327.
Таким образом, точность оценки e=
, а доверительный интервал I 0.98 = (-1.5–0.405; -1.5+0.405) = (-1.905; -1.045).
Заметим, что увеличение объема выборки существенно сузило доверительный интервал.