МАТЕРИАЛЫДЛЯ ПОДГОТОВКИ К КОНТРОЛЬНОЙ РАБОТЕ
Примеры заданий:
1. Раскройте все показатели формулы:
Мода
где – нижняя граница модального интервала; – величина интервала; – частота модального интервала; – частота интервала, предшествующего модальному; – частота интервала, следующего за модальным.
Медиана
где - накопленная частота предыдущего интервала.
Дисперсия
где – арифметическое среднее, n – объем выборки, Xi – i-й элемент выборки X.
Стандартное выборочное отклонение
Коэффициент корреляции Пирсона
где dx – отклонение показателя х от среднего значения dy – отклонение показателя у от среднего значения.
Имеются показатели объема реализации туров в ООО «Ромашка»
Период | октябрь | ноябрь | декабрь | январь | февраль |
Кол-во туров |
Определить цепным и базисным методом: а) абсолютный прирост;
б) темп роста; в) темп прироста; г) динамику реализации продукции изобразить столбиковой диаграммой; д) сделать вывод о динамике спроса у данной туристической компании.
Решение:
Строим таблицу из 8 столбцов, где исходные данные будут отражены в первых двух столбцах, а последующие 6 – это абсолютный прирост (цепной + базисный), темп роста (цепной + базисный), темп прироста (цепной + базисный).
Период | Кол-во туров | Абсолютный прирост* | Темп роста** | Темп прироста*** | |||
Цепной (Ц) | Базисный (Б) | Ц | Б | Ц | Б | ||
Октябрь | Х | Х | Х | Х | |||
Ноябрь | +130 | +130 | 1,11 | 1,11 | 0,11 | 0,11 | |
Декабрь | +370 | +500 | 1,28 | 1,43 | 0,28 | 0,43 | |
Январь | -90 | +410 | 0,95 | 1,35 | -0,05 | +0,35 | |
Февраль | -490 | -80 | 0,69 | 0,93 | -0,31 | -0,07 | |
Ср.знач | -20 | +240 | 1,01 | 1,16 | 0,01 | 0,16 |
Для цепных свойственно сопоставление показателей текущего и предыдущего периода, для базисных – показателей текущего и базисного (первого) периода.
* Абсолютный прирост представляет собой разницу между показателем изучаемого периода и предыдущим / базисным периодом.
** Темп роста представляет собой отношение между показателем изучаемого периода и предыдущим / базисным периодом. (Если считаем в процентах, то умножаем на 100).
*** Темп прироста представляет собой показатель темпа роста уменьшенный на единицу или 100 % для темпа роста, выраженного в процентах.
Сформировать дискретный вариационный ряд, определить частоту, частость, сумму накопленных частот, построить полигон распределения
Условие: Данные об оценках студентов в баллах по результату контрольной работы: 4; 8; 4; 6; 5; 9; 4; 6; 3; 1; 5; 9; 2; 7; 7; 1; 2; 8; 9; 5; 4; 6; 10; 6; 7.
Решение:
Строим таблицу из 4 столбцов, где в первом столбце варианта (в нашем случае вариант оценки в баллах), во втором столбце частота (количество студентов, получивших определенный балл), в третьем столбце сумма накопленных частот (количество оценок до текущей варианты), в четвертом столбце частость (частота, выраженная в процентах).
Варианта (оценка), хi | Частота (кол-во), fi | Сумма накопленных частот S | Частость (кол-во в %), wi |
8 % | |||
8 % | |||
4 % | |||
16 % | |||
12 % | |||
16 % | |||
12 % | |||
8 % | |||
12 % | |||
4 % | |||
Итого: | Х | 100 % |
Рассчитать коэффициент корреляции Пирсона, оценить статистическую значимость, сделать вывод о связи между двумя показателями
Решение:
N | Стоимость тура в Египет в декабре, $ (X) | Процент удовлетв. туристов, % (Y) | Отклонение стоимости от ср.значени (dx) | Отклонение % удовлетв. от среднего значения (dy) | dx2 | dy2 | dx x dy |
1. | -105,20 | -5,2 | 11067,04 | 27,04 | 547,04 | ||
2. | +9,8 | -0,2 | 96,04 | 0,04 | -1,96 | ||
3. | +44,8 | +1,8 | 2007,04 | 3,24 | 80,64 | ||
4. | +115,8 | +6,8 | 13409,64 | 46,24 | 787,44 | ||
5. | -65,2 | -3,2 | 4251,04 | 10,24 | 208,64 | ||
Сумма Σ | Х | Х | 30830,80 | 86,8 | 1621,80 | ||
Ср.знач. (М) | 968,20 | 82,20 | Х | Х | Х | Х | Х |
Расчет коэффициента корреляции Пирсона производится по следующей формуле:
rxy = = = 0,99
Более точную оценку силы корреляционной связи можно получить, если воспользоваться таблицей Чеддока:
Абсолютное значение rxy | Теснота (сила) корреляционной связи |
менее 0.3 | слабая |
от 0.3 до 0.5 | умеренная |
от 0.5 до 0.7 | заметная |
от 0.7 до 0.9 | высокая |
более 0.9 | весьма высокая |
Оценка статистической значимости коэффициента корреляции rxy осуществляется при помощи t-критерия, рассчитываемого по следующей формуле:
tr = = = 12,21
ТАБЛИЦА КРИТИЧЕСКИХ ЗНАЧЕНИЙ t-КРИТЕРИЯ
f p=0,05 p=0,01 p=0,001 1 12,70 63,65 636,61 2 4,303 9,925 31,602 3 3,182 5,841 12,923 4 2,776 4,604 8,610 5 2,571 4,032 6,869 | f p=0,05 p=0,01 p=0,001 6 2,447 3,707 5,959 7 2,365 3,499 5,408 8 2,306 3,355 5,041 9 2,262 3,250 4,781 10 2,228 3,169 4,587 |
Вывод: Между показателями стоимости тура и удовлетворенности потребителей прослеживается весьма высокая сила корреляционной связи, а исходя из табличных критических значений t-критерия можно сделать вывод, что и статистическая значимость весьма высокая, а вероятность ошибки (погрешность) составляет в промежутке между 1% и 0,1 %.
5. Сформировать интервальный вариационный ряд с равными интервалами, определить средние значения (ср.арифм., моду, медиану), оценить вариации данных (размах, дисперсию, стандартное отклонение, коэффициент вариации),
построить кумуляту.
Условие: Данные о средней продолжительности отдыха белорусов по месяцам: 5,4; 4,1; 6,9; 9,1; 8,0; 6,7; 7,8; 4,9; 8,8; 5,1; 4,4; 5,0.
Решение: Построим интервальный вариационный ряд определив интервал по формуле Стерджесса (1 + 3,322*lgN). N=12 (т.к. 12 показателей в условии)
1) 1 + 3,322*lg20 = 5,32 = 5. Т.е. оптимальным является формирование интервального вариационного ряда, состоящего из 5-и интервалов.
2) Размах интервала определим по формуле (Xmax – Xmin)/Кол-во интервалов.
(9,1 – 4,2)/5 = 1
3) Строим таблицу интервалов, начиная с наименьшего и с шагом (размахом) в 1.
Варианта (продолжительность отдыха), Xi | Частота (кол-во продолжительностей отдыха белорусов в интервале), fi | Сумма накопленных частот, S |
[4,1-5,1) | ||
[5,1-6,1) | ||
[6,1-7,1) | ||
[7,1-8,1) | ||
[8,1-9,1] | ||
Итого | Х |
4) Ср. арифметическое: (5,4+4,1+6,9+9,1+8,0+6,7+7,8+4,9+8,8+5,1+4,4+5,0) / 12 = 6,35.
5) Для нахождения медианы определим полусумму частот (12+1)/2=6,5. Следовательно медиальным интервалом будет интервал, где сумма накопленных частот больше 6, т.е. третий интервал (6,1-7,1).
6) Подставим значения в формулу и найдем медиану:
где х0 = 6,1, h = 1, = = 6,5
Ме = 6,1 + 1 * ((6,5 – 6)/2) = 6,35
7) Для нахождения моды определим интервал, которому соответствует наибольшая частота. Следовательно, модальным интервалом будет первый интервал.
8) Подставим значения в формулу и найдем моду:
где хо = 4,1, h = 1, fm = 4 fm-1 = 0 fm+1 = 2.
Мо = 4,1 + 1 * = 4,1 + 1 * ≈ 4,1 + 0,67 ≈ 4,77
9) После нахождения средних переходим к оценкам вариации данных. Первая из них размах.
Р (Размах) = ХMax – ХMin
Р = 9,1 – 4,1 = 5