Задания для практической работы




Математическая статистика

Методические указания для практических и лабораторных работ

по дисциплинам «Математика», «Теория вероятностей»,

«Теория вероятностей и математическая статистика»

для студентов всех форм обучения

всех направлений бакалавриата

 

Тюмень

ТюмГНГУ

Утверждено редакционно-издательским советом

Тюменского государственного нефтегазового университета

 

 

Составители: Овчинникова С.В., к.с.н., доцент

Сартакова А.В., ст. преподаватель

 

 

ã Федеральное государственное бюджетное образовательное учреждение высшего

профессионального образования

«Тюменский государственный нефтегазовый университет», 2011 г.


Введение

Получение высшего образования по всем направлениям бакалавриата требует высокой математической культуры, достаточного глубокого владения рядом специальных математических методов и умения непосредственного их применения в профессиональной деятельности. Методические указания рассчитаны на проведения практических и лабораторных занятий по данному разделу математики. Основной целью МУ является овладение методами математического аппарата для решения прикладных математических задач. В помощь студенту предлагается подробное решение практической работы «Расчет числовых характеристик выборки. Определения закона распределения случайной величины» и лабораторной работы «Построение теоретической линии регрессии в случае линейной корреляционной зависимости».

Также во время проведения практических и лабораторных занятий происходит формирование следующих общекультурных и профессиональных компетенций: способен к обобщению, анализу, восприятию информации, постановке цели и выбору путей её достижения, владеет культурой мышления, способен логически верно, аргументировано и ясно строить устную и письменную речь, способен собрать и проанализировать исходные данные, необходимые для расчета экономических и социально-экономических показателей, характеризующих деятельность хозяйствующих субъектов, способен осуществлять сбор, анализ и обработку данных, необходимых для решения поставленных экономических задач, способен использовать для решения коммуникативных задач современные технические средства и информационные технологии.

 

Практическая работа

«Расчет числовых характеристик выборки.

Определения закона распределения случайной величины »

 

Рейтинговая оценка работы:

1) выполнение – 10 баллов;

2) защита – 5 баллов.

 

Цель работы: ознакомление со способами построения рядов распределения и методом расчёта их числовых характеристик, применение критериев согласия.

Содержание работы:

1. Построить интервальный вариационный ряд. Гистограмму.

2. Перейти от интервального вариационного ряда к дискретному, заменив частичные интервалы их серединами. Построить полигон, кумуляту частот, частостей.

3. Найти эмпирическую функцию распределения.

4. Найти числовые характеристики выборки: моду, медиану, выборочное среднее, выборочное среднее квадратическое отклонение, коэффициент вариации, асимметрию, эксцесс.

5. Сделать предварительный выбор закона распределения случайной величины.

6. Проверить согласованность эмпирической и теоретической функций распределения выбранного закона распределения с помощью критериев согласия χ2-Пирсона, Колмогорова при уровне значимости α=0,05.

7. Определить интервальные оценки для генеральной средней, генерального среднего квадратического отклонения нормального закона распределения с надёжностью γ =0,95.

 

Методика выполнения практической работы.

В течение пятидесяти дней фиксировались цены акций компании “Фауна”. Отклонения от номинальной стоимости даны в таблице:

27,1   28,6 28,8 28,7 28,6 28,5 28,5 29,2 28,7
    29,1 28,6 27,2 28,2 28,5 28,6 28,8 29,3
29,3 29,3 29,1   29,5 29,6 29,7 28,7 28,5 28,7
28,3 28,3 28,2 28,2 28,4 29,8 29,8 29,9 28,7 28,6
29,2   29,2 29,3 29,4 29,9 28,8 28,9 30,1 29,6

 

1. Для построения интервального ряда определим интервальный шаг выборки, воспользовавшись формулой Стерджеса h= (xmax-xmin) / (1+3,322lgn), где n – объём выборки (в нашем случае 50), xmax, xmin соответственно наибольшее и наименьшее значения признака.

h =(30,1-27,1)/(1+3,322 lg 50)=0,45 0,5.

За начало первого интервала примем х1 = xmin - h /2=26,9. В результате получим интервальный ряд.

Интервал (хii+1 ] наблюдённых значений Частота ni Частость wi=ni/n
26,9-27,4   0,04
27,4-27,9    
27,9-28,4   0,14
28,4-28,9   0,36
28,9-29,4   0,28
29,4-29,9   0,16
29,9-30,4   0,02

 

Частота – это количество значений признака, встречающееся в данном интервале. Например, в интервал (27,9;28,4] попадает 7 значений отклонений цены от номинальной стоимости.

Гистограмма – это ступенчатая фигура, состоящая из прямоугольников. Их основаниями служат частичные интервалы, а высоты равны частотам (частостям). Ее график изображен на рис.1.

Рис.1. Гистограмма
 
 

2. Построим дискретный вариационный ряд. Для этого интервалы заменяем их серединами, причем частоты остаются прежними.

xi 27,15 27,65 28,15 28,65 29,15 29,65 30,15
Частота ni              
Частость wi=ni/n 0,04   0,14 0,36 0,28 0,16 0,02

 

Полигон частот (многоугольник распределения) – ломаная, соединяющая точки с координатами (xi, ni) или (xi, wi). Его график отражен ниже на рис.2.

 
 
Рис.2. Полигон частот  
 
 


Кумулята – это кривая накопленных частот (частостей). Для её построения найдём . Ее графическое изображение на рис.3.

 

 

xi 27,15 27,65 28,15 28,65 29,15 29,65 30,15
Частость wi=ni/n 0,04   0,14 0,36 0,28 0,16 0,02
Накопленная частость 0,04 0,04 0,18 0,54 0,82 0,98  

 

Рис.3. Кумулята

 

3. Эмпирической функцией распределения F* (x) называется относительная частота того, что признак примет значение, меньшее заданного x, т.е. F* (x) =w (X<x) = . Она является аналогом функции распределения случайной величины X.

Запишем эмпирическую функцию:

 

4. Модой Мо вариационного ряда называется варианта, которая имеет наибольшую частоту. Мо =28,65.

Медианой Ме вариационного ряда называется значение признака приходящееся на середину ранжированного ряда наблюдений.

Если n=2k+1 (нечётное число), то Ме=хк+1; если n=2k (чётное число), то Ме= (хк+1к)/2. Ме =28,65.

Выборочной средней называют среднее арифметическое значение признака выборочной совокупности:

.

Выборочная дисперсия

Среднее квадратическое отклонение .

Найдём коэффициент вариации .

Определим коэффициент асимметрии, которая характеризует асимметрию полигона вариационного ряда

Вычислим эксцесс, показывающий степень “крутости” выборочного распределения относительно нормального распределения:

5. Предварительный закон распределения может определяться по величине коэффициента вариации наблюдённых данных. Например, для нормального закона распределения он приближённо соответствует интервалу [0,01; 0,40], для экспоненциального – [0,6;1,3], для логарифмического – [0,35;0,8].

Равенство выборочного среднего и выборочной дисперсии может служить основанием выбора пуассоновского распределения. Для теоретического показательного закона распределения характерно равенство выборочного среднего и выборочного среднего квадратического отклонения. В случае нормального закона распределения асимметрия и эксцесс близки к нулю. Гипотеза о нормальности закона распределения может быть принята, если выполняются неравенства: и , где

Вычислим

Основываясь на значениях коэффициентов вариации (находится в интервале [0,01; 0,40]), асимметрии (близок к нулю), эксцесса (близок к нулю) можно предположить, что признак подчинён нормальному закону распределения.

Плотность вероятности .

Тогда функция распределения имеет вид .

Здесь - точечная оценка параметра а, - параметра .

6. Для строгой проверки гипотезы о нормальном распределении признака применим критерии согласия. Они позволяют ответить на вопрос являются ли неизбежные расхождения между эмпирическим и теоретическим распределениями случайными или теоретический закон подобран неудачно.

а) χ2-Пирсона. При его использовании сравниваются эмпирические ni и теоретические (предполагаемые) ni частоты.

Для расчёта вероятностей рi попадания случайной величины Х в интервал [ xi, хi+1 ] используем функцию Лапласа (см. приложение 1) в соответствии со свойством нормального распределения:

Например,

Составим вспомогательную таблицу:

i Интервалы [ xi, хi+1 ] Эмпирические частоты ni Вероятности pi Теоретические частоты ni′=npi (ni- ni)2
  26,9-27,4   0,0073 5,31 0,47
  27,4-27,9   0,0493
  27,9-28,4   0,1695
  28,4-28,9   0,3053 15,27 7,48 0,49
  28,9-29,4   0,2893 14,47 0,22 0,01
  29,4-29,9   0,1387 0,09 0,01
  29,9-30,4   0,0352
  Σ   0,9946 49,76 - χ2набл=0,99

 

Учитывая, что в рассматриваемом эмпирическом распределении частоты первого, второго и последнего интервалов (n1=2; n2=0 и n7=1) меньше пяти, при использовании критерия χ2 Пирсона целесообразно объединить указанные интервалы с соседними.

Итак, фактически наблюдаемое значение статистики =0,99.

Так как новое число интервалов (с учётом объединения крайних) m =4, а нормальный закон имеет два параметра a и σ (r=2), то число степеней свободы k=m-r -1=4-2-1=1. Соответствующее критическое значение статистики при уровне значимости α=0,05
(см. приложение 5). Так как , то нет оснований отвергать гипотезу о распределении случайной величины по нормальному закону.

б) Воспользуемся критерием Колмогорова. При его использовании сравниваются эмпирическая F* (x)и теоретическая (предполагаемая) F(x) функции распределения. Для построения теоретической функции распределения для нормального закона распределения воспользуемся ее выражением через функцию Лапласа:

.

Например,

Составим вспомогательную таблицу

xi 27,15 27,65 28,15 28,65 29,15 29,65 30,15
F*(x)= 0,04 0,04 0,18 0,54 0,82 0,98  
F(x) 0,002 0,023 0,12 0,371 0,692 0,908 0,985
|F*(x)-F(x)| 0,038 0,017 0,06 0,169 0,128 0,072 0,015

 

Вычислим значения D=max |F*(x)-F(x)|= 0,169;

λнабл= .

При уровне значимости α=0,05 табличное значение λα=1,36 (см. приложение 4). Так как λнабл< λα, то нет оснований отвергать гипотезу о распределении случайной величины по нормальному закону.

7. Для нахождения интервальных оценок параметров нормального распределения воспользуемся формулами

,

S(1-q)<σГ<S(1+q),

где - исправленное среднее квадратическое отклонение, t,q – определяются по доверительной вероятности γ и объёму выборки n (см. приложения 2,3)

,

t(γ; n) = t (0,95; 50)=2,009, q(γ; n) = q (0,95; 50)=0,21.

;

0,482< σГ< 0,738.

Первое неравенство означает, что математическое ожидание отклонения цены акции от номинальной с вероятностью 95% попадёт в интервал (28,68; 29,02).

Лабораторная работа

«Построение теоретической линии регрессии в случае линейной корреляционной зависимости »

Рейтинговая оценка работы:

1) выполнение – 10 баллов;

2) защита – 5 баллов.

Цель работы: ознакомиться с методикой построения линий регрессии с последующим анализом достоверности полученных параметров.

 

Содержание работы:

1. Построить корреляционное поле.

2. Найти частоты признаков.

3. Вычислить выборочный коэффициент корреляции.

4. Записать выборочные уравнения прямой и обратной линий регрессии.

5. Построить их на корреляционном поле.

6. Оценить коэффициент корреляции генеральной совокупности.

7. Проверить значимость выборочного коэффициента корреляции по критерию Стьюдента при уровне значимости α=0,05.

8. Найти корреляционное отношение.

9. Проверить значимость корреляционного отношения по критерию Стьюдента при уровне значимости α=0,05.

10. Проверить значимость уравнения прямой линии регрессии по критерию Фишера при уровне значимости α=0,05.

 

Методика выполнения лабораторной работы.

Для исследования зависимости объема производства (Y) от основных фондов (Х) получены статистические данные по 25 предприятиям за год.

 

Y X        
         
         
         

Необходимо установить вид зависимости между объемом производства и основными фондами.

Число 4 в таблице означает, что пара чисел (12, 10) встретилась в выборке 4 раза. Это число называется частотой и обозначается в дальнейшем nij. Значения признаков обозначаются хi, yj, i=1,…, l; j=1,…, m.

 

1. Для предварительного установления вида зависимости Y и X построим корреляционное поле (рис. 4). Нетрудно видеть, что оно располагается вдоль прямой. Это свидетельствует о линейности связи.

Рис. 4

2. Найдем частоты признаков ni= , nj= , записав их в дополнительные столбец и строку корреляционной таблицы. Объем выборки

Y X         ni
 
 
 
 

 

 
 
 

 

          13,33
 
 
 
 

 

 
 
 

 

 
 
 

 

 
 
 

 

      25,71
     
 
 
 

 

 
 
 

 

       
nj         n =25      
               
               

 

3. Выборочный коэффициент корреляции вычисляется по формуле и показывает тесноту линейной связи между признаками. Чем ближе rв по абсолютной величине к 1, тем теснее связь.

;

;

Для вычисления

а) находят произведение частоты nij на варианту y j, которое записывают в правом верхнем углу клетки, содержащее значение частоты. Например, в правых верхних углах третьей строки записаны произведения 2·30=60, 3·40=120.

б) Складывают все числа, помещенные в правых верхних углах одной строки, и их сумму заносят в клетку этой же строки столбца . Например, в третьей строке 60+120=180.

в) Умножают варианту хi на полученные значения и заносят в клетку столбца . Например, в третьей строке 24·180=4320.

г) Сложив все числа найденного столбца, получают сумму .

Для контроля аналогичные вычисления производят по столбцам.

Найдем искомый выборочный коэффициент корреляции:

Коэффициент детерминации означает, что 55% общей дисперсии объема производства обусловлено вариацией основных фондов.

4. Выборочное уравнение прямой линии регрессии Y на Х имеет вид:

Запишем уравнение обратной линии регрессии Х на Y.

5. Построим эти прямые на корреляционном поле по двум точкам соответствующим наибольшему и наименьшему значениям вариант (рис.1).

6. Построим доверительный интервал коэффициента корреляции генеральной совокупности.

rв- Δ <rГ<rв+ Δ, где .

0,47 <rГ< 1,01.

7. Проверим значимость выборочного коэффициента корреляции по критерию Стьюдента.

t кр(23;0,05)=2,07. (см. приложение 7)

| t набл|> t кр нет основания отвергать гипотезу о коррелированности
Х и Y.

8. Общей мерой тесноты связи линейной и нелинейной корреляционной зависимости между признаками является корреляционное отношение.

.

Чем ближе значение корреляционного отношения к 1, тем сильнее связь между признаками.

Вычислим условные средние занеся их в последнюю колонку корреляционной таблицы. Например,

.

Равенство свидетельствует, что корреляционная связь между признаками линейная.

9. Проверим значимость корреляционного отношения по критерию Стьюдента.

t кр(k-2;α)= t кр(23;0,05)=2,07. (см. приложение 7)

| t набл|> t кр нет основания отвергать гипотезу о коррелированности
Х и Y.

10. Проверим значимость уравнения прямой линии регрессии по критерию Фишера.

где k – число оцениваемых параметров;

- сумма квадратов, обусловленная регрессией;

- сумма квадратов отклонений зависимой переменной от средней;

- остаточная сумма квадратов, характеризующая влияние неучтенных факторов.

Вычислим , подставляя значения признака Х в уравнение прямой линии регрессии

xi      
13,8 25,26 36,72

 

Уравнение линейной регрессии содержит два параметра, следовательно k =2.

;

Fкр = F (α, k1, k2) F (α, k-1, n-k)= F (0,05; 1; 23)=4,28 (см. приложение 6).

Fнабл>Fкр, следовательно, уравнение значимо описывает зависимость между признаками.

Задания для практической работы



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-04-26 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: