Числовые характеристики вариационного ряда.




Математические методы обработки данных

Математическими методами обработки данных занимается математическая статистика.

Математическая статистика – раздел математики, посвященный методам сбора, анализа и обработки статистических данных для научных и практических целей, оперирует большим числом объектов и анализирует массовые явления.

Основные понятия

Генеральная совокупность – вся исследуемая совокупность объектов (население страны, студенты вуза, популяция животных и др.)

На практике изучение генеральной совокупности часто затруднено или даже не возможно из-за ее большой мощности (количество элементов, содержащихся в генеральной совокупности) или из-за того, что генеральная совокупность не стационарна (меняется): например население города меняется из-за миграции населения.

 

Чтобы изучить генеральную совокупность делают выборку: отбирают часть элементов генеральной совокупности, и по ней судят о генеральной совокупности.

Выборка – часть объектов исследования, определенным образом выбранная из генеральной совокупности.

 

Чтобы по выборке сделать правильные выводы, она должна быть репрезентативной – достаточно точно отражать доли генеральной совокупности. Для этого нужно соблюдать определенные правила при отборе элементов выборки, которые зависят от конкретной задачи. Наиболее распространен метод собственно-случайного отбора – когда элементы выборки отбираются случайным образом. При этом важно создать условия, при которых все элементы генеральной совокупности имеют равные шансы попасть в выборку. При этом нужно помнить, что выборка почти всегда содержит погрешности относительно генеральной совокупности. Размер этой погрешности зависит от степени репрезентативности выборки, т.е. насколько правильно был проведен отбор.

 

Выборка

Полученные данные в ходе экспериментальной работы представлены в виде неупорядоченного набора чисел. Для того, чтобы по ним можно было делать какие-то выводы, необходима первичная их обработка.

Выборки делятся на:

Простые и сгруппированные

Дискретные и интервальные

Выборка называется простой, если она представлена в виде упорядоченного набора данных.

Выборка называется сгруппированной, если ее элементы группируются по значениям (вариантам)

Выборка называется дискретной, если ее варианты являются числами.

Выборка называется интервальной, если ее варианты являются интервалами.

 

Пример 1.

Простая выборка: 1; 2; 2; 3; 4; 4; 4; 5; 5;5;5;5; 7;7;7;7;7;8;8;10;10;10;11;11;11

Сгруппированная дискретная выборка:

                 
                 

 

Интервальная выборка

1-3 4-7 8-11
     

 

варианты, частоты, объем выборки (количество элементов в выборке)

 

Вариационным рядом называется таблица (обычно упорядоченная по возрастанию вариант) с частотами вариант (см. пример 1)

 

Выборка представляется в виде интервальной, когда количество ее вариант достаточно большое. Количество интервалов часто определяют из практических соображений или из формулы Стерджесса:

( округляется до ближайшего целого)

Сами интервалы часто берут одинаковой величины. Для этого определяется размах выборки:

Тогда ширина частичного интервала равна

Иногда, если получаются малочисленные интервалы (с частотой менее 5), то их объединяют таким образом, чтобы частоты были не менее 5. В этом случае интервалы будут не равными.

 

Для вариационного ряда вычисляют:

Относительныечастоты вариант

Накопленные частоты вариант – сумма всех частот вариант, не превосходящих данную варианту (количество элементов, меньших или равных данному элементу).

 

Числовые характеристики вариационного ряда.

Целью изучения числовых характеристик (параметров) выборки является формирование представления о соответствующей числовой характеристике (параметре) генеральной совокупности. Каждая числовая характеристика может быть вычислена как для генеральной совокупности, так и для выборки. Т.к. для генеральной совокупности эта характеристика не известна, то считается, что она (примерно) равна соответствующей характеристике выборки.

Среднее значение

 

Среднее выборочное - это среднее арифметическое элементов выборки.

 

Простая выборка Дискретная сгруппированная интервальная
– середины интервалов

Среднее выборочное соответствует среднему значению (математическому ожиданию) генеральной совокупности (которое обычно обозначается или ).

 

Мода – варианта с наибольшей частотой. Т.е. то значение, которое чаще всего встречается в рассматриваемой совокупности.

Для интервального ряда сначала находят модальный интервал – интервал с наибольшей частотой. Пусть – модальный интервал, – частота модального интервала, – частота интервала, стоящего слева от модального, –частота интервала, стоящего справа от модального. Тогда

 

Простая выборка Дискретная сгруппированная интервальная
Чаще всего встречающийся элемент с наибольшей частотой

 

Медиана – значение, которое разбивает упорядоченную простую выборку на два равных по количеству элементов подмножества.

Для нахождения медианы простой выборки ее упорядочивают и если количество элементов нечетное число, то медиана – среднее значение, если четное число, то медиана это среднее арифметическое средних значений.

Если выборка сгруппированная, то медиана эта варианта с наименьшей частота которой большей .

Для интервальной выборки

Примечание. Часто для оценки произведения элементов генеральной совокупности вычисляют среднее геометрическое выборки (и считают, что все элементы равны средней геометрической)

 

Характеристики вариации

Размах вариации (см. выше).

Среднее линейное отклонение – показывает среднее отклонение элементов выборки от среднего (арифметического) значения:

Простая выборка Дискретная сгруппированная Интервальная
– середины интервалов

 

Среднее линейное отклонение из-за наличия модулей сложно поддается преобразованиям для дальнейшего использования. Поэтому вместо него используют дисперсию , которое показывает средний квадрат отклонений вариант от среднего значения, и среднее квадратическое отклонение , которое равно корню из дисперсии ().

Простая выборка Дискретная сгруппированная Интервальная
– середины интервалов

 

Обычно для генеральной совокупности дисперсию и среднее квадратическое отклонение обозначают D= и соответственно.

 

Пример 2

Пусть выборка состоит из четырех элементов: 3; 4; 6; 7.

Среднее значение .

=2,5

 

Линейное отклонение и среднее квадратическое отклонение измеряются в техже единицах что и сами элементы выборки (см., руб., кг., м. и т.д.). Чтобы перейти к относительному или % измерению вычисляют коэффициент вариации:

, или

 

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2023-01-17 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: