г) построение ранжированного ряда (таблица 16) выполняется на основе данных простого ряда с помощью команды упорядочения по столбцу V.
Таблица 16
Ранжированный вариационный ряд
V | d=V-M | d2 | |
-11,88 | 141,02 | ||
-6,88 | 47,27 | ||
-6,88 | 47,27 | ||
-6,88 | 47,27 | ||
5 Иванов Василий | -1,88 | 3,52 | |
-1,88 | 3,52 | ||
-1,88 | 3,52 | ||
120 | -1,88 | 3,52 | |
120 | -1,88 | 3,52 | |
3,13 | 9,77 | ||
3,13 | 9,77 | ||
3,13 | 9,77 | ||
3,13 | 9,77 | ||
14 Сидоров Костя | 8,13 | 66,02 | |
8,13 | 66,02 | ||
13,13 | 172,27 | ||
Сумма S) = =СУММ(Диапазон ячеек) | 643,75 | ||
Средняя арифметическая = =СРЗНАЧ(Диапазон ячеек) | 121,875 |
Ме = варианта, занимающая срединное положение; если ряд состоит из четного числа вариант, медианой является полусумма двух центральных вариант = 120уд/мин.
В программе Excel для определения медианы применяться функция =МЕДИАНА(Диапазон ячеек).
д) построение сгруппированного ранжированного ряда (таблица 17) и графика частот (рис. 8).
Таблица 17
Сгруппированный ранжированный
вариационный ряд
V | p | ||||||
120 | 5 | ||||||
S= | |||||||
Рис. 8. График распределения признака. |
е) вычисление моды и средней взвешенной:
Мо = наиболее часто повторяющаяся варианта = 120 уд/мин (встречается 5 раз).
В программе Excel для определения моды применяться функция =МОДА(Диапазон данных).
В сгруппированном вариационном ряду средняя арифметическая вычисляется по модифицированной формуле и называется «Средняя взвешенная»:
Независимо от способа построения вариационного ряда и вычисления средней арифметической, для одинаковых данных значения их средней величины должны совпадать.
ж) определение вида распределения или оценка нормальности. Статистические критерии нормальности распределения определяются с помощью модуля «Описательная статистика», который может быть вызван командой «Данные» - «Анализ данных» - «Описательная статистика».
Если указанных команд нет в ленте «Данные», необходимо выполнить установку модуля «Пакет анализа». Для этого требуется открыть разделы основного меню кнопкой «Office», выбрать «Параметры Excel» -> «На д стройки» -> «Перейти» -> «Пакет анализа» и «Пакет анализа - VBA» -> «ОК». Модуль анализа данных в программе Excel, как правило, не подключается при типовой установке пакета программ Microsoft Office. В связи с этим требуется однократно выполнить дополнительную настройку программы.
Результат вычислений, выполненный модулем «Описательная статистика», показан в таблице 18.
Таблица 18
Простой неранжированный вариационный ряд | ||||||
V | d=V-M | d2 | Результат выполнения команды «Анализ данных» -> «Описательная статистика». | |||
1 Иванов Василий | -1,88 | 3,52 | ||||
2 Сидоров Костя | 8,13 | 66,02 | Столбец1 | |||
3 … | -6,88 | 47,27 | Среднее | 121,875 | ||
4 … | -1,88 | 3,52 | Стандартная ошибка | 1,63777 | ||
5 … | -1,88 | 3,52 | Медиана | |||
6 … | 3,13 | 9,77 | Мода | |||
7 … | -11,88 | 141,02 | Стандартное отклонение | 6,551081 | ||
8 … | 3,13 | 9,77 | Дисперсия выборки | 42,91667 | ||
9 … | -6,88 | 47,27 | Эксцесс | -0,16979 | ||
10 … | -1,88 | 3,52 | Асимметричность | 0,209598 | ||
11 … | 3,13 | 9,77 | Интервал | |||
12 … | 13,13 | 172,27 | Минимум | |||
13 … | -6,88 | 47,27 | Максимум | |||
14 … | 8,13 | 66,02 | Сумма | |||
15 … | 3,13 | 9,77 | Счет | |||
16 … | -1,88 | 3,52 | Наибольший(1) | |||
S= | 0,00 | 643,75 | Наименьший(1) | |||
n=16 | Уровень надежности(95,0%) | 3,490827 |
Эксцесс = -0,17. Распределение близко к нормальному. Для нормального распределения эксцесс = 0.
Асимметричность = 0,2. Распределение близко к симметричному. Для нормального распределения асимметричность = 0.
Модуль «Описательная статистика» программы Excel вычисляет множество параметров вариационного ряда. При этом ошибка средней арифметической (m) обозначается «Стандартная ошибка», а в качестве среднего квадратического отклонения используется «Стандартное отклонение».
ж) с вероятностью P>95% доверительные границы колебания средней арифметической в генеральной совокупности = М ± 2 m = 121,9 ± 2*1,64 =
121,9 ± 3,28уд/мин.
Вывод: Средняя частота пульса пациентов 1-го отделения с вероятностью 95,5% составляет от 118,6 до 125,2 ударов в минуту.
Пример сравнения рассеяния вариационных рядов.
Условие задачи: Для выявления общей характеристики частоты сердечных сокращений (ЧСС) детей 1-го года жизни в отделении №2 больницы выполнено 17 измерений пульса у детей: 1. Казаков Саша – 130 уд.в мин; 2. Литвинов Сережа – 135 уд.в мин.; 3…– 125; 4… – 115; 5 …– 125; 6 … – 125; 7 … – 120; 8 … – 125;
9 … – 130; 10 … – 120; 11 … – 140; 12 … – 145; 13 … – 115; 14 …– 130; 15 … – 125; 16 … – 120; 17 … – 125.
Задание: а) создать простой и сгруппированный, ранжированный вариационный ряды, определить средние величины вариационного ряда;
б) построить график распределения признака и проверить его на нормальность;
в) определить параметры вариабельности признака: амплитуду, размах, среднее квадратическое отклонение, коэффициент вариации и ошибку репрезентативности;
г) сравнить характеристики рассеяния вариационных рядов, используемых в примерах данного раздела.
Решение: запустите программу Excel, откройте требуемый файл в папке своей учебной группы под именем «Статистика–Фамилии студентов». На листе «Сред_вел» этого файла введите данные в соответствии с таблицей 19, выполните вычисления с помощью формул и модуля «Описательная статистика». Покажите результат работы преподавателю.
а) построение вариационных рядов (таблицы 19, 20) и вычисление их основных характеристик.
Таблица 19
Простой ранжированный вариационный ряд и его характеристики
V | d=V-M | d2 | Результат выполнения команды «Анализ данных» -> «Описательная статистика». | |||
11,18 | 124,91 | |||||
11,18 | 124,91 | Столбец1 | ||||
11,18 | 124,91 | |||||
6,18 | 38,15 | Среднее | 126,1764706 | |||
6,18 | 38,15 | Стандартная ошибка | 2,035051839 | |||
1,18 | 1,38 | Медиана | ||||
1,18 | 1,38 | Мода | ||||
1,18 | 1,38 | Стандартное отклонение | 8,390733685 | |||
1,18 | 1,38 | Дисперсия выборки | 70,40441176 | |||
1,18 | 1,38 | Эксцесс | 0,3573165 | |||
1,18 | 1,38 | Асимметричность | 0,659063476 | |||
12 Казаков | -3,82 | 14,62 | Интервал | |||
-3,82 | 14,62 | Минимум | ||||
-3,82 | 14,62 | Максимум | ||||
15 Литвинов | -8,82 | 77,85 | Сумма | |||
-13,82 | 191,09 | Счет | ||||
-18,82 | 354,33 | Наибольший(1) | ||||
S= | 0,00 | 1126,47 | Наименьший(1) | |||
n =17 | Уровень надежности(95,0%) | 4,314116203 | ||||
M2 = | 126,2 | |||||
m2 = | 2,04 | Сигма (σ)= 8,390734 | C =6,6% |
Вывод: Средняя частота пульса пациентов 2-го отделения с вероятностью 95,5% составляет 126,2±2,04 ударов в минуту, вариабельность малая.
Таблица 20
Сгруппированный, ранжированный вариационный ряд | ||||||
V | p | |||||
125 | 6 | |||||
S p = | ||||||
n =17 | ||||||
Рис. 9. График распределения признака. |
б) Ме = варианта, занимающая срединное положение =МЕДИАНА(Диапазон данных) = 125 уд/мин.
Мо = наиболее часто повторяющаяся варианта
=МОДА(Диапазон данных) = 125 уд/мин.
в) амплитуда (интервал) = 30 уд/мин, размах от 115 до 145 уд/мин и среднеквадратическое отклонение = 8,4 уд/мин, коэффициент вариации = 6,6%, ошибка репрезентативности = 2,04 уд/мин.
Вывод: вариабельность пульса пациентов 1-го отделения (С=5,4%) ниже, чем пациентов 2-го отделения больницы (С=6,6%) и в обоих случаях малая (<10%).