Задача 4. «Сводка и группировка данных»




Задача № 1

 

Условие

 

Приведены статистические данные (Таблица № 1): таблица отметок студенческой группы на контрольной работе – 23 студента, 6 переменных (пол и отметки за 5 задач).

 

 

Задание 1.1. Построить таблицу:

Подлежащее: комбинация пола и отметки по задаче № 4

Сказуемое: отметка по задаче № 1

 

 

Задание 1.2. Построить столбчатую диаграмму для четных номеров вариантов по журналу для распределения отметок по задаче № 2

 

 

Задание 1.3. Построить вариационный ряд и рассчитать выборочные характеристики:

1. выборочное среднее арифметическое

2. выборочная дисперсия

3. выборочное среднее квадратичное отклонение

4. коэффициент вариации

5. медиана

6. минимум

7. максимум

8. размах

9. мода

10. амплитуда моды

11. верхний квартиль

12. нижний квартиль

13. межквартильное расстояние

 

ПЕРЕМЕННАЯ: отметка по задаче № 3

 

 

Фамилия И.О. / Номер задачи          
Балашов В.В.          
Бережная Т.В.          
Бушуев С.Б.          
Воздвиженская Н.С          
Громыко Алексей          
Гвирц Леонид          
Иванова И.Г.          
Канакова Е.М.          
Комаров П.В.          
Краснова М.В.          
Куроптев О.В.          
Любимов Р.А.          
Меньшикова Е.В.          
Ободинская Е.А.          
Пономарева М.А.          
Рафальская А.Э.          
Смирницкий А.В.          
Соловьева Е.          
Сорокин Д.А.          
Трунова А.          
Филинова А.Ю.          
Эйдинов А.М.          
Ярославцева Ю.В.          

 

 

Решение.

Задача № 1.1

Комбинация пола и оценки по задаче № 4 Оценка по задаче № 1 Сумма
                     
М                          
                         
                         
                         
                         
                         
                         
                         
                         
                         
                         
Сумма                        
Ж                          
                         
                         
                         
                         
                         
                         
                         
                         
                         
                         
Сумма                        

Задача № 1.2

  Оценки по задаче № 2
                       
Кол-во                      

Задача №1.3

Данные по задаче № 3

 

Данные задачи № 3
Оценки                                              

 

Оценки        
Кол-во повторений        

 

1. Выборочное среднее:

2. Выборочная дисперсия:

; :

3. Выборочное среднее квадратичное отклонение

; = = 1.69

 

 

4. Коэффициент вариации

= ; V= ; = 0.77

5. Медиана. Т.к в выборке присутствует только 0,1,3 и 5, то число четное (n=2k) =>

= ; = 2

6. Минимум.

; =0

7. Максимум.

;

8. Размах.

.

9. Мода – самое часто повторяющиеся значение выборки. Мода 0.

10. Амплитуда моды – число повторений моды. Амплитуда моды 9.

11. Нижний квантиль.

;

12. Верхний квартиль

; x = 3

13. Межквартильноерастояние.

;

 

Задача № 2.

Условия

Исходные данные:

В двух выборках присутствуют объекты, обладающие определенными свойствами.

 

Объем первой выборки 625.

Из них обладают рассматриваемым свойством 400.

Объем второй выборки 2500.

Из них обладают рассматриваемым свойством 900.

 

Задание 2.1. Укажите доверительные границы для долей объектов в двух выборках, обладающих определенным свойством (с доверительной вероятностью 0.95).

 

Задание 2.2. Проверьте гипотезу о равенстве долей (уровень значимости a=0.05).

 

Решение

 
 

Задание 2.1.

а) Объем выборки 625 из них свойством обладают 400.

 

 

б) Объем выборки 2500 из них свойством обладают 900.

 

Задание 2.2.

Оценкой pявляется = 0.416

 

= = 0.64; = = 0.36

 

Т.к по таблице приложений =;=> ____<____ __ принимается.

 

 

Задача № 3.

Условия

xk= atk + b + ek, k = 1,2,…,n,

tk            
xk            

1. Методом наименьших квадратов оцените параметры a и b линейной зависимости. Выпишите восстановленную зависимость.

2. Вычислите восстановленные значения зависимой переменной, сравните их с исходными значениями (найдите разности) и проверьте условие точности вычислений (при отсутствии ошибок в вычислениях сумма исходных значений должна равняться сумме восстановленных).

3. Найдите остаточную сумму квадратов и оцените дисперсию погрешностей.

4. Выпишите точечный прогноз, а также верхнюю и нижнюю доверительные границы для него (для доверительной вероятности 0,95).

5. Рассчитайте прогнозное значение и доверительные границы для него для

момента t = 12.

6. Как изменятся результаты, если доверительная вероятность будет увеличена? А если она будет уменьшена?

Решение.

Задача 3.1.-3.2.

;

 

Оценки метода наименьших квадратов – это такие значения , при которых функция достигнет максимума по всем значениям аргументов.

 

i
          3.36 11.23 0.77 0.5929
          10.08 17.95 -1.95 3.8025
          13.44 21.31 -1.31 1.7161
          16.8 24.67 1.33 1.7689
          23.52 31.39 2.61 6.8121
          33.6 41.47 -1.47 2.1609
            -0.02 16.8534
  24.67 33.33 151.33        

 

;

Функция имеет вид:

=

Задача 3.3.

SS= 16.8534 – остаточная сумма квадратов

 

Дисперсия погрешностей и их среднего квадратического отклонения:

 

 

 

Задача 3.4.

Дисперсия оценивается как 2.8089/6 = 0,468

Оценкой среднего квадратического отклонения является 0.684

Значит при доверительной вероятности 0,95 доверительный интервал для параметра b имеет вид

( )

(24.67 – 1.96*0.684; 24.67+1.96*0.684)

(23.32;26.01)

В формулах для дисперсии учувствует величина = 200 – 6(5)2= 50

Дисперсия оценивается как 2.8089/50 = 0,0561

Оценкой среднего квадратического отклонения является 0.2370

Значит при доверительной вероятности 0,95 доверительный интервал для параметра b имеет вид

( )

 

(3.36 – 1.96*0.2370; 3.36+1.96*0.2370)

(2.89; 3.82)

 

Задача 3.5.

В момент времени t = 12

Нижняя доверительная граница 44,66

Верхняя доверительная граница 51,71

Доверительный интервал (44.66; 51.71)

Погрешность в прогностической формуле.

Примимt -> ∞ =>

 

Значит, погрешности составляют

Задача 3.6.

Если постепенно увеличивать доверительную вероятность, то будет расти ошибка расчетов, если уменьшать доверительную вероятность, то расширяется выборка, что влечет к значениям, которые попадут в выборочный интервал, но погрешность при этом уменьшится.

 

 

Задача 4. «Сводка и группировка данных»

Условия

По данным талицы выполнить следующее:

1. Произвести группировку 30 предприятий отрасли по стоимости промышленно-производственных фондов с равными или неравными интервалами (используя критерий выбора (не)равных интервалов). Число групп определите самостоятельно, но не менее 4-х (на основе анализа исходной информации).

2. Для каждого полученного интервала по стоимости ОПФ рассчитайте средние значения остальных показателей по группе.

3. Результаты изложите в сводной групповой таблице. Сделайте анализ полученных данных.

 

 

№ предприятия Объем производства изделий, усл.нат.ед., шт. Товарная продукция в оптовых ценах предприятий, млн.руб. Стоимость основных производст-венных фондов, млн.руб. Среднесписочная численность промышленно-производственного персонала, чел.
         
    44,3 5,1  
    130,3 25,8  
    66,1 7,3  
    37,5 6,4  
    29,3 3,6  
    87,3 16,2  
    110,1 16,5  
    76,2 8,8  
      22,7  
    102,8 12,7  
    29,7 3,9  
    24,1 13,2  
    46,9 13,6  
    150,6 30,2  
    112,5 18,1  
         
    27,3 4,5  
    111,2 23,5  
    117,2 23,7  
    47,6 7,1  
    27,7 1,4  
    112,1 17,3  
    67,1 8,9  
    35,2 4,2  
    42,4 4,6  
    34,1 1,1  
    53,4 6,2  
    35,3 2,8  
    65,8 11,9  
    47,4 5,5  

 

Решение

Группировку произведем по показателю стоимости основных производственных фондов (столбец № 4).Разделим предприятия на 5 групп с равными интервалами интервалом в 6.1.

Количествоинтерваловвыбиралпоформуле (Heinhold I..>gaede K.W. Ingeniur statistic. – München; Wien, SpringlerVerlag, 1964. – 352s)

 

№ предприятия Объем производства изделий, усл.нат.ед., шт. Товарная продукция в оптовых ценах предприятий, млн.руб. Стоимость основных производст-венных фондов, млн.руб. Среднесписочная численность промышленно-производственного персонала, чел.
         
I группа в интервале [0;6.1)
    34,1 1,1  
    27,7 1,4  
    35,3 2,8  
    29,3 3,6  
    29,7 3,9  
    35,2 4,2  
    27,3 4,5  
    42,4 4,6  
    44,3 5,1  
    47,4 5,5  
II группа в интервале [6.1;12.2)
    53,4 6,2  
    37,5 6,4  
    47,6 7,1  
    66,1 7,3  
         
    76,2 8,8  
    67,1 8,9  
    65,8 11,9  
III группа в интервале [12.2; 18.3)
    102,8 12,7  
    24,1 13,2  
    46,9 13,6  
    87,3 16,2  
    110,1 16,5  
    112,1 17,3  
    112,5 18,1  
IV группа в интервале [18.3; 24.4)
      22,7  
    111,2 23,5  
    117,2 23,7  
V группа в интервале [24.4; 30.5)
    130,3 25,8  
    150,6 30,2  

 

 

Сводная таблица со средними значениями по группам.

№ группы Объем производства изделий, усл.нат.ед., шт. (средний) Товарная продукция в оптовых ценах предприятий, млн.руб. (средний) Стоимость основных производст-венных фондов, млн.руб. (средний) Среднесписочная численность промышленно-производственного персонала, чел. (средний)
I 490.4 35.27 3.67 758.8
II 715.63 58.59 8.075 526.25
III 1168.85 85.11 15.37 879.43
IV   123.8 23.3  
V 1383.5 140.45   961.5
По всем без выделения групп 835,1   11,16 761,77

 

 

0.332

0.784

Коэффициенты были рассчитаны для указания зависимости между показателями 4 столбца и 1.

Из данного анализа можно сделать следующие выводы: существует зависимость между данными показателями (сильная, так как коэффициент Пирсона >0.3)Произведена сводка по группам и рассчитаны средние показатели внутри групп.

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-12-12 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: