Тема 2.
Реализация случайного выбора.
- Реализация случайного выбора.
- Распределение качественных и количественных признаков.
- Выборочные характеристики и их свойства.
- Распределение выборочных характеристик.
Реализация случайного выбора.
Реализация эмпирической функции распределения.
Совокупность (Х1, Х2, …. Хп) п независимых случайных величин Хi, распределенных по одному и тому же закону, совпадающему с законом распределения случайной величины Х, называется выборкой объема п из генеральной совокупности Х (величины Хi представляют собой п экземпляров одной и той же случайной величины Х).
Если (Х1, Х2, …. Хп) – выборка, то последовательность чисел (х1, х2, …. хп) называется реализацией этой выборки.
Важнейшее значение для описания некоторой случайной переменной Х имеет функция распределения вероятностей F (Х) = .
Если функция распределения неизвестна, можно на основе реализации (Х1, Х2, …. Хп) выборки объема п из генеральной совокупности Х построить некоторое приближение к F(Х) с помощью функции , где n (x) – число значений Хi, меньших чем х). Эта функция представляет собой реализацию эмпирической функции распределения Wn(х).
Если (Х1, Х2, …. Хп) некоторая выборка, а (х1, х2, …. хп) – её реализация, тогда выборочная функция называется выборочным средним, а реализацией выборочного среднего.
Если выборка извлекается из генеральной совокупности случайной переменной Х с математическим ожиданием , тогда Е ()= .
Реализация выборочной дисперсии составляет .
Если выборка извлекается из генеральной совокупности с математическим ожиданием и дисперсией
, тогда Е() =
Статистическая оценка параметров.
|
Рассмотрим вопрос о том, как на основе некоторой выборки (Х1, Х2, …. Хп) найти оценку определенного параметра (например, математического ожидания или дисперсии) распределения случайной переменной Х.
Истинное значение некоторого параметра «а» обозначим через , его оценку с помощью некоторой выборочной функции через « », а реализацию выборочной функции через .
1. Оценка = (х1, х2, …, хп) некоторого параметра «а» называется симметричной, если выборочная функция (х1, х2, …, хп) является симметричной.
2. Оценка = (х1, х2, …, хп) некоторого параметра «а» называется несмещенной, если Е = .
3. Оценка = (х1, х2, …, хп) некоторого параметра «а» называется состоятельной, если её значение при n 0 с вероятностью 1 сходится к истинному значению , т.е. Р =1.
4. Оценка = (х1, х2, …, хп) некоторого параметра «а» называется эффективной, если среди всех других возможных оценок она обладает наименьшей дисперсией:
D () = Е = min.
Оценка для математического ожидания некоторой случайной переменной Х является симметричной, состоятельной и несмещенной, а для случая, когда величина Х распределена по нормальному закону, также и эффективной.
Оценка для дисперсии случайной переменной Х является симметричной, состоятельной и несмещенной, а в случае нормального распределения величины Х также и эффективной.
5. Пусть Х – нормально распределенная случайная величина, неизвестное математическое ожидание и дисперсию которой требуется оценить. Обозначим а1= , а2= и введем эти обозначения в выражение плотности вероятностей нормального распределения
= = :
; .
Полученная с помощью некоторой выборочной функции = (х1, х2, …, хп) конкретная оценка = (х1, х2, …, хп) параметра «а» не дает, однако, возможности судить о том, как точно найденная оценка воспроизводит истинное значение параметра «а», даже если она является несмещенной и эффективной. Разумеется, величину разности нельзя определить точно, если распределение Х и величина не известны, так как есть всего лишь реализация случайной величины . Однако можно найти некоторую область, которая с вероятностью Р содержит истинное значение параметра «а». Если, например, F(Х) – функция распределения величины , то можно рассчитать вероятность
|
Р = Р
Если задано, то Р определяет вероятность того, что случайная переменная отличается от менее чем на , или вероятность того, что истинное значение параметра менее чем на отличается от оценки .
Истинное значение с вероятностью Р, задаваемой выражением Р = , находится между - и + , то есть в интервале , представляющем собой реализацию интервала
интервал называется обычно доверительным, а вероятность Р – доверительной вероятностью.
6. Если с 95%-ной надежностью, требуется обеспечить ошибку , возникает вопрос о том, какой минимальный объем выборки (n) для этого потребуется.
Задача здесь может быть поставлена так:
Найти минимальное целое число «n», для которого с вероятностью Р = 0,95 отклонение .
Для всякой заданной вероятности Р с помощью таблицы нормированного нормального распределения можно найти соответствующее значение .
При Р/2=0,95/2=0,475 находим Е = 1,96.
С учетом этого : При известной
Таким образом, для достижения требуемой точности здесь потребуется сделать около 100 опытов.
|
Тема 3.