СЛУЧАЙНОГО ВЕКТОРА
Пример1. Вычислить выборочные средние , , несмещенные оценки дисперсий , и коэффициент корреляции для выборки
Решение. Для расчетов воспользуемся формулами
, (4)
где n – объем выборки, n ij– частота появления пары элементов (x i, y j) выборки; n i – частота появления элемента x i (при любом y); n j – частота появления элемента y (при любом x).
В рассматриваемом примере среди значений x i, y j нет повторяющихся, поэтому
Вычисления удобно свести в таблицу.
Таблица 8
i | |||||||
Последний столбец таблицы служит для контроля вычислений с помощью тождества
(В данном случае: 530 = 334 + 2∙86 + 24).
Используя данные из последней строки и учитывая (8),по формулам (4)–(7)получаем
Пример 2. В табл. 9приведены результаты измерений двух физических величин в ходе некоторого эксперимента
Таблица 9
Вычислить средние, несмещенные оценки дисперсий и коэффициента корреляции, предварительно сгруппировав выборку и составив корреляционную таблицу.
Решение. Определим размах выборки по х и по у
В данном случае для группировки элементов выборки удобно использовать четыре интервала по х и два интервала по у. Определим длины интервалов группировки
Группировку выборки можно производить по диаграмме рассеивания (см. рис. 9). Для построения этой диаграммы нанесем элементы выборки (x i, y j) в виде точек на плоскость с выбранной системой координат.
Рис. 9
Будем считать, что элементы выборки, которые попали на границу двух соседних прямоугольников, относятся к верхнему или к правому прямоугольнику, и составим корреляционную таблицу.
Таблица 10
y | x | 46-50 | 50-54 | 54-58 | 58-62 |
16-18 | |||||
18-20 |
Здесь x i*, y j* – означают середины интервалов группировки. В клетках таблицы записываются частоты (то есть число пар исходной выборки, попавших в данный прямоугольник) для каждого прямоугольника на диаграмме рассеивания.
Для вычисления искомых оценок параметров распределения по сгруппированной выборке можно использовать те же формулы (4)–(7),в которых x i, y jследует заменить на x i*, y j*, а , , – на частоты попадания элементов выборки в соответствующие интервалы , , .
Однако, если x i*, y j*достаточно велики, то для упрощения вычислений рекомендуется ввести вспомогательные случайные величины
где d x, d y–наиболее часто встречающиеся значения x i* и y j*.Найти их параметры распределения по формулам, аналогичным (4)–(7),а затем воспользоваться соотношениями
(11)
В заданном примере .
Результаты промежуточных вычислений представим в виде таблицы (табл. 11).
По формулам (4) - (7)используя найденные в таблице вспомогательные суммы , , , , и вычислив имеем
Таблица 11
xi* | ||||||||
yj* | ui vj | -1 | ||||||
-1 | -10 | |||||||
-5 | ||||||||
Возвращаясь к заданным случайным величинам, по формулам (11) получим
Пример 3. По выборке из примера 2 оценить параметры линейной регрессии X на Y и Y на X и составить уравнения прямых регрессии.
Решение. Уравнения прямых регрессии Y на X и X на Y были получены в курсе теории вероятностей и имеют вид
Заменяя в этих уравнениях числовые характеристики mx, my, , , rxy их статистическими оценками, получим
(12)
(13)
Подставляя в эти уравнения найденные в предыдущем примере значения , , Sx, Sy, rxy имеем
Отсюда следует, что уравнения линейной регрессии Y на X и X на Y имеют соответственно вид
Отметим, что эти прямые пересекаются в точке (). Угол между ними уменьшается при увеличении , а при = 1, прямые регрессии совпадают.
Решите примеры, используя данные своего варианта, приведенные в Приложении 2, табл. 1,2.
4. В ходе некоторого эксперимента были многократно измерены две физические величины X и Y. Результаты измерений записаны в таблицу. Обработайте результаты эксперимента по следующему плану:
1) постройте диаграмму рассеивания;
2) составьте корреляционную таблицу;
3) вычислите средние, несмещенные оценки дисперсий среднеквадратичных отклонений и оцените коэффициент корреляции;
4) составьте уравнения прямых регрессии и нанесите эти прямые на диаграмму рассеивания.
5. Вычислить выборочные средние , , несмещенные оценки дисперсий , и коэффициент корреляции для выборки, представленной в табл. 2 приложения 2.
ИНТЕРВАЛЬНЫЕ ОЦЕНКИ
Интервальной называют оценку, которая определяется двумя числами — концами интервала, покрывающего оцениваемый параметр.
Доверительным называют интервал, который с заданной надежностью покрывает заданный параметр.
1. Интервальной оценкой с надежностью математического ожидания а нормально распределенного количественного признака по выборочной средней при известном среднем квадратическом отклонении σ генеральной совокупности служит доверительный интервал
,
Где =δ – точность оценки, n - объем выборки, t – значение аргумента функции Лапласа Ф(t) при котором Ф(t)=γ/2.
2. При неизвестном σ (и объеме выборки n<30)
,
где s - «исправленное» выборочное среднее квадратическое отклонение, t находят по таблице квантилей распределения Стьюдента по заданным n и γ.
Пример 1. Найти доверительный интервал для оценки с надежностью 0,95 неизвестного математического ожидания a нормально распределенного признака X генеральной совокупности, если генеральное среднее квадратичное отклонение σ = 5, выборочная средняя = 14 и объем выборки n = 25.
Решение. Требуется найти доверительный интервал
,
Все величины, кроме t, известны. Найдем t из соотношения Ф(t) = 0,95/2=0,475. По таблице находим t = 1,96. Подставив t = 1,96, = 14, σ = 5, n = 25, окончательно получим искомый доверительный интервал 12,04 < a < 15,96.
Пример 2. Из генеральной совокупности извлечена выборка объема n = 10, представленная в табл. 12.
Таблица 12
варианта xi | -2 | |||||
частота ni |
Оценить с надежностью 0,95 математическое ожидание а нормально распределенного признака генеральной совокупности по выборочной средней при помощи доверительного интервала.
Решение. Выборочную среднюю и «исправленное» среднее квадратичное отклонение найдем соответственно по формулам:
, .
Подставив в эти формулы данные задачи, получим = 2, s = 2,4. Найдем tγ. Пользуясь таблицей, по γ = 0,95 и n = 10 находим tγ = 2,26. Найдем искомый доверительный интервал:
.
Подставляя в эти формулы данные задачи, получим = 2, tγ = 2,26, s = 2,4, n= 10, получим искомый доверительный интервал 0,3< a < 3,7, покрывающий неизвестное математическое ожидание а с надежностью 0,95.
3. Пусть известно, что контролируемое напряжение в задаче 10 параграфа 1 распределено по нормальному закону. Найти доверительный интервал для оценки с надежностью 0,99 неизвестного математического ожидания a.