Рассчитать коэффициент корреляции Пирсона, оценить статистическую значимость, сделать вывод о связи между двумя показателями




МАТЕРИАЛЫДЛЯ ПОДГОТОВКИ К КОНТРОЛЬНОЙ РАБОТЕ

Примеры заданий:

1. Раскройте все показатели формулы:

Мода

где – нижняя граница модального интервала; – величина интервала; – частота модального интервала; – частота интервала, предшествующего модальному; – частота интервала, следующего за модальным.

 

Медиана

где - накопленная частота предыдущего интервала.

Дисперсия

где – арифметическое среднее, n – объем выборки, Xi – i-й элемент выборки X.

Стандартное выборочное отклонение

Коэффициент корреляции Пирсона

где dx – отклонение показателя х от среднего значения dy – отклонение показателя у от среднего значения.

 

Имеются показатели объема реализации туров в ООО «Ромашка»

Период октябрь ноябрь декабрь январь февраль
Кол-во туров          

 

Определить цепным и базисным методом: а) абсолютный прирост;

б) темп роста; в) темп прироста; г) динамику реализации продукции изобразить столбиковой диаграммой; д) сделать вывод о динамике спроса у данной туристической компании.

 

Решение:

Строим таблицу из 8 столбцов, где исходные данные будут отражены в первых двух столбцах, а последующие 6 – это абсолютный прирост (цепной + базисный), темп роста (цепной + базисный), темп прироста (цепной + базисный).

 

 

Период Кол-во туров Абсолютный прирост* Темп роста** Темп прироста***
Цепной (Ц) Базисный (Б) Ц Б Ц Б
Октябрь   Х Х Х   Х  
Ноябрь   +130 +130 1,11 1,11 0,11 0,11
Декабрь   +370 +500 1,28 1,43 0,28 0,43
Январь   -90 +410 0,95 1,35 -0,05 +0,35
Февраль   -490 -80 0,69 0,93 -0,31 -0,07
Ср.знач   -20 +240 1,01 1,16 0,01 0,16

Для цепных свойственно сопоставление показателей текущего и предыдущего периода, для базисных – показателей текущего и базисного (первого) периода.

* Абсолютный прирост представляет собой разницу между показателем изучаемого периода и предыдущим / базисным периодом.

** Темп роста представляет собой отношение между показателем изучаемого периода и предыдущим / базисным периодом. (Если считаем в процентах, то умножаем на 100).

*** Темп прироста представляет собой показатель темпа роста уменьшенный на единицу или 100 % для темпа роста, выраженного в процентах.

Сформировать дискретный вариационный ряд, определить частоту, частость, сумму накопленных частот, построить полигон распределения

Условие: Данные об оценках студентов в баллах по результату контрольной работы: 4; 8; 4; 6; 5; 9; 4; 6; 3; 1; 5; 9; 2; 7; 7; 1; 2; 8; 9; 5; 4; 6; 10; 6; 7.

 

Решение:

Строим таблицу из 4 столбцов, где в первом столбце варианта (в нашем случае вариант оценки в баллах), во втором столбце частота (количество студентов, получивших определенный балл), в третьем столбце сумма накопленных частот (количество оценок до текущей варианты), в четвертом столбце частость (частота, выраженная в процентах).

 

Варианта (оценка), хi Частота (кол-во), fi Сумма накопленных частот S Частость (кол-во в %), wi
      8 %
      8 %
      4 %
      16 %
      12 %
      16 %
      12 %
      8 %
      12 %
      4 %
Итого:   Х 100 %

 


Рассчитать коэффициент корреляции Пирсона, оценить статистическую значимость, сделать вывод о связи между двумя показателями

Решение:

N Стоимость тура в Египет в декабре, $ (X) Процент удовлетв. туристов, % (Y) Отклонение стоимости от ср.значени (dx) Отклонение % удовлетв. от среднего значения (dy) dx2 dy2 dx x dy
1.     -105,20 -5,2 11067,04 27,04 547,04
2.     +9,8 -0,2 96,04 0,04 -1,96
3.     +44,8 +1,8 2007,04 3,24 80,64
4.     +115,8 +6,8 13409,64 46,24 787,44
5.     -65,2 -3,2 4251,04 10,24 208,64
Сумма Σ     Х Х 30830,80 86,8 1621,80
Ср.знач. (М) 968,20 82,20 Х Х Х Х Х

Расчет коэффициента корреляции Пирсона производится по следующей формуле:

rxy = = = 0,99

Более точную оценку силы корреляционной связи можно получить, если воспользоваться таблицей Чеддока:

Абсолютное значение rxy Теснота (сила) корреляционной связи
менее 0.3 слабая
от 0.3 до 0.5 умеренная
от 0.5 до 0.7 заметная
от 0.7 до 0.9 высокая
более 0.9 весьма высокая

Оценка статистической значимости коэффициента корреляции rxy осуществляется при помощи t-критерия, рассчитываемого по следующей формуле:

tr = = = 12,21

ТАБЛИЦА КРИТИЧЕСКИХ ЗНАЧЕНИЙ t-КРИТЕРИЯ

f p=0,05 p=0,01 p=0,001   1 12,70 63,65 636,61 2 4,303 9,925 31,602 3 3,182 5,841 12,923 4 2,776 4,604 8,610 5 2,571 4,032 6,869 f p=0,05 p=0,01 p=0,001   6 2,447 3,707 5,959 7 2,365 3,499 5,408 8 2,306 3,355 5,041 9 2,262 3,250 4,781 10 2,228 3,169 4,587

 

Вывод: Между показателями стоимости тура и удовлетворенности потребителей прослеживается весьма высокая сила корреляционной связи, а исходя из табличных критических значений t-критерия можно сделать вывод, что и статистическая значимость весьма высокая, а вероятность ошибки (погрешность) составляет в промежутке между 1% и 0,1 %.

5. Сформировать интервальный вариационный ряд с равными интервалами, определить средние значения (ср.арифм., моду, медиану), оценить вариации данных (размах, дисперсию, стандартное отклонение, коэффициент вариации),
построить кумуляту.

Условие: Данные о средней продолжительности отдыха белорусов по месяцам: 5,4; 4,1; 6,9; 9,1; 8,0; 6,7; 7,8; 4,9; 8,8; 5,1; 4,4; 5,0.

Решение: Построим интервальный вариационный ряд определив интервал по формуле Стерджесса (1 + 3,322*lgN). N=12 (т.к. 12 показателей в условии)

1) 1 + 3,322*lg20 = 5,32 = 5. Т.е. оптимальным является формирование интервального вариационного ряда, состоящего из 5-и интервалов.

2) Размах интервала определим по формуле (Xmax – Xmin)/Кол-во интервалов.

(9,1 – 4,2)/5 = 1

3) Строим таблицу интервалов, начиная с наименьшего и с шагом (размахом) в 1.

 

Варианта (продолжительность отдыха), Xi Частота (кол-во продолжительностей отдыха белорусов в интервале), fi Сумма накопленных частот, S
[4,1-5,1)    
[5,1-6,1)    
[6,1-7,1)    
[7,1-8,1)    
[8,1-9,1]    
Итого   Х

4) Ср. арифметическое: (5,4+4,1+6,9+9,1+8,0+6,7+7,8+4,9+8,8+5,1+4,4+5,0) / 12 = 6,35.

5) Для нахождения медианы определим полусумму частот (12+1)/2=6,5. Следовательно медиальным интервалом будет интервал, где сумма накопленных частот больше 6, т.е. третий интервал (6,1-7,1).

6) Подставим значения в формулу и найдем медиану:

где х0 = 6,1, h = 1, = = 6,5

Ме = 6,1 + 1 * ((6,5 – 6)/2) = 6,35

7) Для нахождения моды определим интервал, которому соответствует наибольшая частота. Следовательно, модальным интервалом будет первый интервал.

8) Подставим значения в формулу и найдем моду:

где хо = 4,1, h = 1, fm = 4 fm-1 = 0 fm+1 = 2.

 

Мо = 4,1 + 1 * = 4,1 + 1 * ≈ 4,1 + 0,67 ≈ 4,77

9) После нахождения средних переходим к оценкам вариации данных. Первая из них размах.

Р (Размах) = ХMax – ХMin

Р = 9,1 – 4,1 = 5



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2019-02-11 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: