Федеральное агентство по культуре и кинематографии
Федеральное государственное образовательное учреждение
Высшего профессионального образования
«Санкт-Петербургский государственный университет
Кино и телевидения»
Кафедра Бухгалтерского учета
Курсовой проект
по дисциплине: «Статистика»
тема: «Статистическая обработка данных»
Вариант № 14
Выполнил:
Майорова Д. В., 041 гр.
Проверил:
Санкт-Петербург
Содержание
1. Постановка задачи. Цель работы. Исходные
данные……………………………………………………………..3
2. Вычисление основных выборочных характеристик по заданной выборке……………………………………………………………..3
3. Результаты вычисления интервальных оценок для математического ожидания и дисперсии…………………..…………………………5
4. Результаты ранжирования выборочных данных и вычисление моды и медианы……………………………………………………………..10
5. Параметрическая оценка функции плотности распределения……………………………………….……………….13
6. Проверка гипотезы о нормальном распределении случайной величины по критерию Пирсона…………………………………………………..17
7. Литература…………………………..…………………………….20
Введение
Сейчас, всю нашу жизнь можно преобразовать в статистику.
В науке термин «статистика» появился в 1746 году, ввел его немецкий ученый Готфрид Ахенваль.
Статистика – отрасль знаний, в которой излагаются общие вопросы сбора, измерения и анализа массовых статистических (количественных или качественных) данных; изучение количественной стороны массовых общественных явлений в числовой форме.
Цель курсового проекта:
• иметь представление о сущности статистики как науки и ее роли в
управлении государством;
• приобрести знания и навыки в исчислении и анализе статистических
показателей в различных отраслях экономики;
• приобрести навыки по сбору и обработке статистической информации;
• приобрести навыки по анализу результатов экономического развития
предприятия;
• приобрести навыки по построению прогнозов экономических процессов;
• сформировать научно-исследовательскую компоненту статистического
мышления.
Раздел 1. Статистическая обработка результатов выборочных наблюдений
Постановка задачи
По выборке объёма n провести статистическую обработку результатов
выборочных наблюдений (статистических наблюдений).
Цель работы:
- изучить и усвоить основные понятия дисциплины “Статистика”;
- овладеть методикой статистического оценивания числовых
характеристик случайной величины и нормального закона
распределения;
- ознакомиться с методикой применения статистических критериев для
проверки гипотез.
Исходные данные:
Проведен эксперимент, в результате которого, была получена выборка объема
N=60, которая соответствует случайной величине, распределенной по
нормальному закону.
Таблица 1.1.1
Выборка – вариант 14
13,53 | 14,82 | 11,78 | 12,14 | ||||
12,58 | 13,05 | 13,38 | 14,49 | ||||
13,10 | 13,74 | 12,84 | 13,04 | ||||
12,85 | 13,83 | 14,16 | 13,71 | ||||
12,09 | 12,50 | 13,37 | 12,67 | ||||
12,21 | 13,52 | 11,69 | 14,81 | ||||
11,62 | 12,10 | 14,24 | 11,38 | ||||
14,12 | 14,74 | 12,51 | 12,46 | ||||
14,42 | 13,95 | 12,44 | 12,04 | ||||
12,39 | 12,88 | 12,00 | 14,22 | ||||
15,37 | 14,97 | 12,09 | 13,84 | ||||
12,05 | 12,96 | 13,29 | 11,65 | ||||
12,10 | 12,83 | 13,38 | 14,44 | ||||
12,33 | 12,87 | 12,67 | 12,98 | ||||
14,70 | 12,82 | 13,06 | 12,95 |
Вычисление основных числовых характеристик
Выборочных наблюдений
1. Среднее арифметическое случайной величины Х
N=60
∑
Х= i=1 =13.11
N
2. Среднее линейное отклонение
N=60
d = 1 ∑ |Xi – X| = 48,1/60 = 0,8
N i=1
3. Дисперсия случайной величины Х
N=60
D[X] = σ2 = 1 ∑ (Xi – X)2 = 56,20/60 = 0,94
N i=1
4. Несмещенная оценка дисперсии
N=60
D[X] = σ2 = 1 ∑ (Xi – X)2 = 56,20/59 = 0,95
N-1 i=1
5. Среднее квадратическое отклонение
σ = √ D[X] = √0,94 = 0,97
6. Несмещенная выборочная оценка для среднего квадратического отклонения
σ = √ D[X] = √0,95 = 0,975
7. Коэффициент вариации
V = 0,975 * 100% = 7,44%
13,11
8. Коэффициент ассиметрии случайной величины Х
N=60
As = 1 ∑ (Xi – X)3 = 0,453
N i=1
σ3
9. Коэффициент экцесса случайной величины Х
N=60
E = 1 ∑ (Xi – X)4 - 3= - 0,782
N i=1
σ 4
10. Вариационных размах
R = Xmax - Xmin = 15,37 -11,38 = 3,99
На основании полученных вычислений можно сделать следующие выводы:
1) необходимое условие для того, чтобы выборка имела нормальный закон распределения, выполняется, т.к. для коэффициента вариации V выполняется неравенство:
V = 7,44 % < 33%
2) для нормального распределения коэффициенты асимметрии и эксцесса должны быть равны нулю, т.е. As = E = 0.
По результатам вычисления асимметрия As = -0,453 и коэффициент эксцесса Е = -0,782 не близки к нулю.
Коэффициент асимметрии равен As= -0,453. Он отрицательна, а это значит, что «длинная часть» кривой располагается слева от математического ожидания.
Коэффициент эксцесса равен Е= -0,782. Он отрицательный, а это означает, что функция плотности имеет более низкую и плоскую вершину, чем плотность нормального распределения. В связи с этим необходимы дополнительные исследования для выяснения степени близости распределения выборки к нормальному распределению.
Результаты вычисления интервальных оценок для математического ожидания и дисперсии
Для вычисления интервальной оценки математического ожидания воспользуемся известной формулой
Где а=М[X] – математическое ожидание
N-1 =V – число степеней свободы
t v,p – величина, численно равная половине интервала, в который может попасть случайная величина Х, имеющая определенный закон распределения при заданной доверительной вероятности ρ и заданном числе степеней свободы V.
t v,p подставляем в формулу вычисленные ранее значения Х, σ и N в результате получим
0,975 0,975
13,11– t 59,p √60 <а< 13,11 + t 59,p √60
Задаемся доверительной вероятностью
Р1 = 0,95; Р2 = 0,99
Для каждого значения р1 (i =1,2) находим по таблице 3.1.1 (из методички) значения t59;pi и вычисляем два варианта интервальных оценок для математического ожидания.
При р1 =0,95 t59; 0,95 =2,00
13,0775 <а< 13,1425
При р2 = 0,99 t59; 0,95 = 2,66
13,067 <а< 13,153
Для интервальной оценки дисперсии существуют следующие неравенства:
(N-1) σ 2 < σ2 < (N-1) σ 2
x22 x21
Подставляя в неравенство известные значения N и σ получим неравенство, в котором неизвестны x22 и x21.
59*0,975 < σ2 < 59*0,975
x22 x21
Задаваясь доверительной вероятностью р1 (или уровнем значимости α) вычисляем значения 1-р1 и 1+р1.
2 2
Используя эти два значения и степень свободы v=N-1 по таблице 1.3.2 (в методичке) находим x21 и x21
=
=
=
=
x22 и x21 - это границы интервала, в который попадает случайная величина Х, имеющая x2 (хи-квадрат) распределение при выбранной вероятности pi и заданной степени свободы v.
Для p1 = 0,95 1-p1 = 0,025; 1+p1 =0,975 и v=59 находим по таблице 3.2
2 2
x21 = x2 0,975;59= 40,4817
x22 = x2 0,025;59= 83,2976
Подставляя в неравенства x21 и x22 и произведя вычисления получим интервальную оценку
0,691 < σ2 < 1,421
Для p2 = 0,99 1-p2 = 0,005; 1+p2 =0,995 и v=59 находим по таблице 3.2
2 2
x21 = x2 0,995;59= 35,5346
x22 = x2 0,005;59= 91,9517
Подставляя в неравенства x21 и x22 и произведя вычисления получим интервальную оценку
0,626 < σ2 < 1,619
Для интервальной оценки среднего квадратического отклонения имеем
√N-1 * σ < σ < √N-1 * σ
√ x22 √ x21
При p1 = 0,95; 0,8204 < σ < 1,1768
При p2 = 0,99; 0,7808 < σ < 1,2562