Задания для практической работы

Математическая статистика

Методические указания для практических и лабораторных работ

по дисциплинам «Математика», «Теория вероятностей»,

«Теория вероятностей и математическая статистика»

для студентов всех форм обучения

всех направлений бакалавриата

Тюмень

ТюмГНГУ

Утверждено редакционно-издательским советом

Тюменского государственного нефтегазового университета

Составители: Овчинникова С.В., к.с.н., доцент

Сартакова А.В., ст. преподаватель

ã Федеральное государственное бюджетное образовательное учреждение высшего

профессионального образования

«Тюменский государственный нефтегазовый университет», 2011 г.

Введение

Получение высшего образования по всем направлениям бакалавриата требует высокой математической культуры, достаточного глубокого владения рядом специальных математических методов и умения непосредственного их применения в профессиональной деятельности. Методические указания рассчитаны на проведения практических и лабораторных занятий по данному разделу математики. Основной целью МУ является овладение методами математического аппарата для решения прикладных математических задач. В помощь студенту предлагается подробное решение практической работы «Расчет числовых характеристик выборки. Определения закона распределения случайной величины» и лабораторной работы «Построение теоретической линии регрессии в случае линейной корреляционной зависимости».

Также во время проведения практических и лабораторных занятий происходит формирование следующих общекультурных и профессиональных компетенций: способен к обобщению, анализу, восприятию информации, постановке цели и выбору путей её достижения, владеет культурой мышления, способен логически верно, аргументировано и ясно строить устную и письменную речь, способен собрать и проанализировать исходные данные, необходимые для расчета экономических и социально-экономических показателей, характеризующих деятельность хозяйствующих субъектов, способен осуществлять сбор, анализ и обработку данных, необходимых для решения поставленных экономических задач, способен использовать для решения коммуникативных задач современные технические средства и информационные технологии.

Практическая работа

«Расчет числовых характеристик выборки.

Определения закона распределения случайной величины »

Рейтинговая оценка работы:

1) выполнение – 10 баллов;

2) защита – 5 баллов.

Цель работы: ознакомление со способами построения рядов распределения и методом расчёта их числовых характеристик, применение критериев согласия.

Содержание работы:

1. Построить интервальный вариационный ряд. Гистограмму.

2. Перейти от интервального вариационного ряда к дискретному, заменив частичные интервалы их серединами. Построить полигон, кумуляту частот, частостей.

3. Найти эмпирическую функцию распределения.

4. Найти числовые характеристики выборки: моду, медиану, выборочное среднее, выборочное среднее квадратическое отклонение, коэффициент вариации, асимметрию, эксцесс.

5. Сделать предварительный выбор закона распределения случайной величины.

6. Проверить согласованность эмпирической и теоретической функций распределения выбранного закона распределения с помощью критериев согласия χ^2-Пирсона, Колмогорова при уровне значимости α=0,05.

7. Определить интервальные оценки для генеральной средней, генерального среднего квадратического отклонения нормального закона распределения с надёжностью γ =0,95.

Методика выполнения практической работы.

В течение пятидесяти дней фиксировались цены акций компании “Фауна”. Отклонения от номинальной стоимости даны в таблице:

27,1		28,6	28,8	28,7	28,6	28,5	28,5	29,2	28,7
		29,1	28,6	27,2	28,2	28,5	28,6	28,8	29,3
29,3	29,3	29,1		29,5	29,6	29,7	28,7	28,5	28,7
28,3	28,3	28,2	28,2	28,4	29,8	29,8	29,9	28,7	28,6
29,2		29,2	29,3	29,4	29,9	28,8	28,9	30,1	29,6

1. Для построения интервального ряда определим интервальный шаг выборки, воспользовавшись формулой Стерджеса h= (x_max-x_min) / (1+3,322lgn), где n – объём выборки (в нашем случае 50), x_max, x_min – соответственно наибольшее и наименьшее значения признака.

h =(30,1-27,1)/(1+3,322 lg 50)=0,45 0,5.

За начало первого интервала примем х₁ = x_min - h /2=26,9. В результате получим интервальный ряд.

Интервал (х_i;х_i+1 ] наблюдённых значений	Частота n_i	Частость w_i=n_i/n
26,9-27,4		0,04
27,4-27,9
27,9-28,4		0,14
28,4-28,9		0,36
28,9-29,4		0,28
29,4-29,9		0,16
29,9-30,4		0,02

Частота – это количество значений признака, встречающееся в данном интервале. Например, в интервал (27,9;28,4] попадает 7 значений отклонений цены от номинальной стоимости.

Гистограмма – это ступенчатая фигура, состоящая из прямоугольников. Их основаниями служат частичные интервалы, а высоты равны частотам (частостям). Ее график изображен на рис.1.

Рис.1. Гистограмма

2. Построим дискретный вариационный ряд. Для этого интервалы заменяем их серединами, причем частоты остаются прежними.

x_i	27,15	27,65	28,15	28,65	29,15	29,65	30,15
Частота n_i
Частость w_i=n_i/n	0,04		0,14	0,36	0,28	0,16	0,02

Полигон частот (многоугольник распределения) – ломаная, соединяющая точки с координатами (x_i, n_i) или (x_i, w_i). Его график отражен ниже на рис.2.

Рис.2. Полигон частот

Кумулята – это кривая накопленных частот (частостей). Для её построения найдём . Ее графическое изображение на рис.3.

x_i	27,15	27,65	28,15	28,65	29,15	29,65	30,15
Частость w_i=n_i/n	0,04		0,14	0,36	0,28	0,16	0,02
Накопленная частость	0,04	0,04	0,18	0,54	0,82	0,98

Рис.3. Кумулята

3. Эмпирической функцией распределения F* (x) называется относительная частота того, что признак примет значение, меньшее заданного x, т.е. F* (x) =w (X<x) = . Она является аналогом функции распределения случайной величины X.

Запишем эмпирическую функцию:

4. Модой Мо вариационного ряда называется варианта, которая имеет наибольшую частоту. Мо =28,65.

Медианой Ме вариационного ряда называется значение признака приходящееся на середину ранжированного ряда наблюдений.

Если n=2k+1 (нечётное число), то Ме=х_к+1; если n=2k (чётное число), то Ме= (х_к+1+х_к)/2. Ме =28,65.

Выборочной средней называют среднее арифметическое значение признака выборочной совокупности:

Выборочная дисперсия

Среднее квадратическое отклонение .

Найдём коэффициент вариации .

Определим коэффициент асимметрии, которая характеризует асимметрию полигона вариационного ряда

Вычислим эксцесс, показывающий степень “крутости” выборочного распределения относительно нормального распределения:

5. Предварительный закон распределения может определяться по величине коэффициента вариации наблюдённых данных. Например, для нормального закона распределения он приближённо соответствует интервалу [0,01; 0,40], для экспоненциального – [0,6;1,3], для логарифмического – [0,35;0,8].

Равенство выборочного среднего и выборочной дисперсии может служить основанием выбора пуассоновского распределения. Для теоретического показательного закона распределения характерно равенство выборочного среднего и выборочного среднего квадратического отклонения. В случае нормального закона распределения асимметрия и эксцесс близки к нулю. Гипотеза о нормальности закона распределения может быть принята, если выполняются неравенства: и , где

Вычислим

Основываясь на значениях коэффициентов вариации (находится в интервале [0,01; 0,40]), асимметрии (близок к нулю), эксцесса (близок к нулю) можно предположить, что признак подчинён нормальному закону распределения.

Плотность вероятности .

Тогда функция распределения имеет вид .

Здесь - точечная оценка параметра а, - параметра .

6. Для строгой проверки гипотезы о нормальном распределении признака применим критерии согласия. Они позволяют ответить на вопрос являются ли неизбежные расхождения между эмпирическим и теоретическим распределениями случайными или теоретический закон подобран неудачно.

а) χ^2-Пирсона. При его использовании сравниваются эмпирические n_i и теоретические (предполагаемые) n_i′ частоты.

Для расчёта вероятностей р_i попадания случайной величины Х в интервал [ x_i, х_i₊₁ ] используем функцию Лапласа (см. приложение 1) в соответствии со свойством нормального распределения:

Например,

Составим вспомогательную таблицу:

i	Интервалы [ x_i, х_i+1 ]	Эмпирические частоты n_i	Вероятности p_i	Теоретические частоты n_i′=np_i	(n_i- n_i′)²
	26,9-27,4		0,0073		5,31	0,47
	27,4-27,9		0,0493
	27,9-28,4		0,1695
	28,4-28,9		0,3053	15,27	7,48	0,49
	28,9-29,4		0,2893	14,47	0,22	0,01
	29,4-29,9		0,1387		0,09	0,01
	29,9-30,4		0,0352
	Σ		0,9946	49,76	-	χ²_набл=0,99

Учитывая, что в рассматриваемом эмпирическом распределении частоты первого, второго и последнего интервалов (n₁=2; n₂=0 и n₇=1) меньше пяти, при использовании критерия χ² Пирсона целесообразно объединить указанные интервалы с соседними.

Итак, фактически наблюдаемое значение статистики =0,99.

Так как новое число интервалов (с учётом объединения крайних) m =4, а нормальный закон имеет два параметра a и σ (r=2), то число степеней свободы k=m-r -1=4-2-1=1. Соответствующее критическое значение статистики при уровне значимости α=0,05
(см. приложение 5). Так как , то нет оснований отвергать гипотезу о распределении случайной величины по нормальному закону.

б) Воспользуемся критерием Колмогорова. При его использовании сравниваются эмпирическая F* (x)и теоретическая (предполагаемая) F(x) функции распределения. Для построения теоретической функции распределения для нормального закона распределения воспользуемся ее выражением через функцию Лапласа:

Например,

Составим вспомогательную таблицу

x_i	27,15	27,65	28,15	28,65	29,15	29,65	30,15
F(x)=*	0,04	0,04	0,18	0,54	0,82	0,98
F(x)	0,002	0,023	0,12	0,371	0,692	0,908	0,985
\|F(x)-F(x)\|*	0,038	0,017	0,06	0,169	0,128	0,072	0,015

Вычислим значения D=max |F*(x)-F(x)|= 0,169;

λ_набл= .

При уровне значимости α=0,05 табличное значение λ_α=1,36 (см. приложение 4). Так как λ_набл< λ_α, то нет оснований отвергать гипотезу о распределении случайной величины по нормальному закону.

7. Для нахождения интервальных оценок параметров нормального распределения воспользуемся формулами

S(1-q)<σ_Г<S(1+q),

где - исправленное среднее квадратическое отклонение, t,q – определяются по доверительной вероятности γ и объёму выборки n (см. приложения 2,3)

t(γ; n) = t (0,95; 50)=2,009, q(γ; n) = q (0,95; 50)=0,21.

;

0,482< σ_Г< 0,738.

Первое неравенство означает, что математическое ожидание отклонения цены акции от номинальной с вероятностью 95% попадёт в интервал (28,68; 29,02).

Лабораторная работа

«Построение теоретической линии регрессии в случае линейной корреляционной зависимости »

Рейтинговая оценка работы:

1) выполнение – 10 баллов;

2) защита – 5 баллов.

Цель работы: ознакомиться с методикой построения линий регрессии с последующим анализом достоверности полученных параметров.

Содержание работы:

1. Построить корреляционное поле.

2. Найти частоты признаков.

3. Вычислить выборочный коэффициент корреляции.

4. Записать выборочные уравнения прямой и обратной линий регрессии.

5. Построить их на корреляционном поле.

6. Оценить коэффициент корреляции генеральной совокупности.

7. Проверить значимость выборочного коэффициента корреляции по критерию Стьюдента при уровне значимости α=0,05.

8. Найти корреляционное отношение.

9. Проверить значимость корреляционного отношения по критерию Стьюдента при уровне значимости α=0,05.

10. Проверить значимость уравнения прямой линии регрессии по критерию Фишера при уровне значимости α=0,05.

Методика выполнения лабораторной работы.

Для исследования зависимости объема производства (Y) от основных фондов (Х) получены статистические данные по 25 предприятиям за год.

Y X

Необходимо установить вид зависимости между объемом производства и основными фондами.

Число 4 в таблице означает, что пара чисел (12, 10) встретилась в выборке 4 раза. Это число называется частотой и обозначается в дальнейшем n_ij. Значения признаков обозначаются х_i, y_j, i=1,…, l; j=1,…, m.

1. Для предварительного установления вида зависимости Y и X построим корреляционное поле (рис. 4). Нетрудно видеть, что оно располагается вдоль прямой. Это свидетельствует о линейности связи.

Рис. 4

2. Найдем частоты признаков n_i= , n_j= , записав их в дополнительные столбец и строку корреляционной таблицы. Объем выборки

Y X

n_i

13,33

25,71

n_j

n =25

3. Выборочный коэффициент корреляции вычисляется по формуле и показывает тесноту линейной связи между признаками. Чем ближе r_в по абсолютной величине к 1, тем теснее связь.

;

Для вычисления

а) находят произведение частоты n_ij на варианту y _j, которое записывают в правом верхнем углу клетки, содержащее значение частоты. Например, в правых верхних углах третьей строки записаны произведения 2·30=60, 3·40=120.

б) Складывают все числа, помещенные в правых верхних углах одной строки, и их сумму заносят в клетку этой же строки столбца . Например, в третьей строке 60+120=180.

в) Умножают варианту х_i на полученные значения и заносят в клетку столбца . Например, в третьей строке 24·180=4320.

г) Сложив все числа найденного столбца, получают сумму .

Для контроля аналогичные вычисления производят по столбцам.

Найдем искомый выборочный коэффициент корреляции:

Коэффициент детерминации означает, что 55% общей дисперсии объема производства обусловлено вариацией основных фондов.

4. Выборочное уравнение прямой линии регрессии Y на Х имеет вид:

Запишем уравнение обратной линии регрессии Х на Y.

5. Построим эти прямые на корреляционном поле по двум точкам соответствующим наибольшему и наименьшему значениям вариант (рис.1).

6. Построим доверительный интервал коэффициента корреляции генеральной совокупности.

r_в- Δ <r_Г<r_в+ Δ, где .

0,47 <r_Г< 1,01.

7. Проверим значимость выборочного коэффициента корреляции по критерию Стьюдента.

t _кр(23;0,05)=2,07. (см. приложение 7)

| t _набл|> t _крнет основания отвергать гипотезу о коррелированности
Х и Y.

8. Общей мерой тесноты связи линейной и нелинейной корреляционной зависимости между признаками является корреляционное отношение.

Чем ближе значение корреляционного отношения к 1, тем сильнее связь между признаками.

Вычислим условные средние занеся их в последнюю колонку корреляционной таблицы. Например,

Равенство свидетельствует, что корреляционная связь между признаками линейная.

9. Проверим значимость корреляционного отношения по критерию Стьюдента.

t _кр(k-2;α)= t _кр(23;0,05)=2,07. (см. приложение 7)

| t _набл|> t _крнет основания отвергать гипотезу о коррелированности
Х и Y.

10. Проверим значимость уравнения прямой линии регрессии по критерию Фишера.

где k – число оцениваемых параметров;

- сумма квадратов, обусловленная регрессией;

- сумма квадратов отклонений зависимой переменной от средней;

- остаточная сумма квадратов, характеризующая влияние неучтенных факторов.

Вычислим , подставляя значения признака Х в уравнение прямой линии регрессии

x_i
	13,8	25,26	36,72

Уравнение линейной регрессии содержит два параметра, следовательно k =2.

;

F_кр = F (α, k₁, k₂) F (α, k-1, n-k)= F (0,05; 1; 23)=4,28 (см. приложение 6).

F_набл>F_кр, следовательно, уравнение значимо описывает зависимость между признаками.

Задания для практической работы

№1. Даны значения овальности валиков (в мк.):

№2. Даны значения овальности валиков (в мк.):

№3. Даны значения диаметров шестерён обработанных на станке:

№4. Даны значения температуры масла заднего моста автомобиля ГАЗ - 53 при средних скоростях:

№5. Даны значения механической скорости проходки на ста скважинах при одном и том же числе израсходованных долот:

№6. Даны значения механической скорости проходки на ста скважинах при одном и том же числе израсходованных долот:

№7. Даны значения температуры смазочного масла коробки передач автомобиля ГАЗ - 53 при средних скоростях:

№8. Даны значения температуры смазочного масла коробки передач автомобиля ГАЗ - 53 при средних скоростях:

№9. Даны значения числа израсходованных долот на 100 скважин при механической ск

12 Следующая ⇒

Поделиться:

Поиск по сайту

©2015-2026 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-04-26 Нарушение авторских прав и Нарушение персональных данных

Поиск по сайту:

Читайте также:

Деталирование сборочного чертежа

Когда производственнику особенно важно наличие гибких производственных мощностей?

Собственные движения и пространственные скорости звезд

Тема 11. Банковские риски и способы их оценки

Опросник «Активность повседневной жизни»

Интересно:

Роль современного учителя в повышении качества школьного образования

Как правильно принимать препараты кальция?

Роль страхования в рыночной экономике

Что такое энтеровирусная инфекция?

Обратная связь