ЛАБОРАТОРНАЯ РАБОТА № 1
ГРУППИРОВКА И ПОСТРОЕНИЕ ГИСТОГРАММЫ.
ОПРЕДЕЛЕНИЕ ВЫБОРОЧНЫХ ХАРАКТЕРИСТИК
Введение
Исходные данные: выборка
,
Здесь
- значение регистрируемого признака для
-го элемента выборки,
- объем выборки.
Признак - свойство (характеристика) элемента выборки (единицы статистической совокупности).
Например:
| Единица статистической совокупности | Признак |
| Фирма | Прибыль, количество сотрудников и т.п. |
| Магазин | Площадь, товарооборот и т.п. |
| Сотрудник | Возраст, заработная плата и т.п. |
| Студент | Оценка на экзамене, средний балл и т.п. |
| Автомобиль | Расход топлива, максимальная скорость и т.п. |
В качестве выборки используйте данные из файла Data.txt
Выберите анализируемый признак согласно номеру Вашего варианта:
| Признак | Номер варианта | ||||||||
| Время разгона | |||||||||
| Вес | |||||||||
| Мощность | |||||||||
| Объём |
Задание 1. ГРУППИРОВКА И ПОСТРОЕНИЕ ГИСТОГРАММЫ
Группировка - это распределение единиц совокупности по группам в соответствии с группировочным признаком.
Благодаря группировке данные приобретают систематизированный вид. На основе группировки рассчитываются сводные показатели по группам, появляется возможность их сравнения и изучения взаимосвязей.
Алгоритм группировки с равными интервалами
1. По формуле Стерджесса

с учётом округления определяем рекомендуемое количество групп, которое может быть подкорректировано.
2. Находим величину интервала
,
где
– наибольшее и наименьшее значение признака в исследуемой совокупности.
3. Определяем границы (крайние точки) каждого интервала
,
.
Нижняя граница первого интервала
.
Таким образом,
1-й интервал имеет границы от
до
:
,
2-й интервал имеет границы от
до
:
,
…
-й интервал имеет границы от
до
:
.
4. Находим центральные значения (середину) интервалов
, 
5. Находим численность каждой из групп (частоты)
,
.
Для этого подсчитаем число элементов выборки, попавших в каждый из интервалов.
6. Находим относительную частоту (частость) ─ долю элементов
-й группы в выборке
,
.
Очевидно, что
.
В результате группировки единицы выборки распределяются по группам на основе значений изучаемого признака.
Представим результаты группировки в табличной форме.
| № группы | Интервал | Середина интервала | Среднее по группе | Частота | Относительная частота |
|
|
|
|
| |
|
|
|
|
| |
| … | … | … | … | … | |
|
|
|
|
|
|
В результате группировки обычно определяют, какие именно объекты попали в 1-ю, 2-ю и другие группы.
Графическое представление распределения исследуемого признака осуществляется с помощью гистограммы (столбиковой диаграммы).
Постройте гистограмму частот для исследуемого признака

Постройте гистограмму относительных частот для исследуемого признака

С помощью гистограммы может быть представлена непараметрическая оценка плотности вероятности. Для этого высоты прямоугольников (сплошных столбиков) строятся равными
, а основание ─ величине интервалов
. В данном случае интервалы равны между собой
.
Задание 2. ОПРЕДЕЛЕНИЕ ВЫБОРОЧНЫХ ХАРАКТЕРИСТИК
Рассчитайте выборочные характеристики, используя данные согласно номеру Вашего варианта.
| Выборочные характеристики | Для не сгруппированных данных | Для сгруппированных данных |
| Среднее значение |
|
|
| Медиана | − для нечетного ,
− для четного
| ─ |
| Выборочные показатели вариации (степени рассеяния) признака | ||
| Размах вариации |
| ─ |
| Квартильный размах |
| ─ |
| Среднее линейное отклонение |
|
|
| Среднее квадратическое отклонение |
|
|
| Дисперсия |
|
|
| Коэффициент вариации |
|
|
В таблице обозначено:
─
-й элемент вариационного ряда (упорядоченных выборочных значений),
─ третий квартиль,
─ первый квартиль.
Примечание: При расчете по сгруппированным данным в качестве
используются средние по группам значения. Если эти значения неизвестны, то используют центральные значения интервалов, что приводит к приближенным результатам.
Если значение коэффициента вариации коэффициента вариации не превышает 33%, то исследуемая совокупность считается количественно однородной. Если значение коэффициента вариации коэффициента вариации меньше 25%, то вариация считается слабой.
− для нечетного
,
− для четного