Характеристики формы распределения.




Тема 6. Анализ рядов распределения

Показатели вариации.

Средняя величина дает обобщающую характеристику всей совокупности изучаемого явления. Однако два ряда распределения, имеющих одинаковую среднюю арифметическую величину, могут значительно отличаться друг от друга по степени колеблемости (вариации) величины изучаемого признака. Если индивидуальные значения признака ряда мало отличаются друг от друга, то средняя арифметическая будет достаточно показательной характеристикой данной совокупности. Если же ряд распределения характеризуется значительным рассеиванием индивидуальных значений признака, то средняя арифметическая будет ненадежной характеристикой этой совокупности и ее практическое применение будет ограничено.

Значение показателей вариации заключается в следующем:

- показатели вариации дополняют средние величины, за которыми скрываются индивидуальные значения признаков вариационного ряда;

- показатели вариации характеризуют степень однородности статистической совокупности по изучаемому признаку;

- показатели вариации характеризуют границы колеблемости признака;

- соотношение показателей вариации характеризует взаимосвязь между признаками.

Для измерения вариации признака в рядах распределения применяются различные абсолютные и относительные показатели. В статистике чаще всего применяются следующие показатели (меры) вариации: размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение и коэффициент вариации.

Рассмотрим подробно каждый из перечисленных показателей вариации.

Размах вариации (размах колебаний) представляет собой разность между максимальным и минимальным значениями признака и определяется по формуле:

 

(6.1)

где R – размах вариации;

xmax – максимальное значение признака;

хmin – минимальное значение признака.

Пример. Наблюдения показывают, что скорость движения легковых автомобилей находится в диапазоне 20-90 км/ч., грузовых автомобилей – в пределах 20-80 км/ч., маршрутных автобусов – 20-60 км/ч., автобусов междугородних сообщений – 20-90 км/ч. Определим размах вариации скоростей этих видов транспорта. Расчет представлен в таблице 13.

Таблица 6.1

Скорости движения транспортных средств

Вид транспорта Скорость, км/ч. Скорость км/ч. Размах вариации
Легковые автомобили     R=90-20=70 км\ч.
Грузовые автомобили     R=80-20=60 км\ч.
Маршрутные автобусы     R=60-20=40 км\ч.
Междугородние автобусы     R=90-20=70 км\ч.

Безусловным достоинством этого показателя является простота его расчета, поэтому он не редко используется и в технике и в экономике. Однако размах вариации зависит от величины только крайних значений признака, что делает в известной мере случайной его величину. Поэтому его целесообразно применять при изучении достаточно однородных статистических совокупностей.

Более надежный показатель – средний размах вариации, вычисляемый как средняя арифметическая из ряда размахов, полученных в результате обработки равных серий наблюдений. Таким показателем, пользуются, например, при контроле качества продукции.

Среднее линейное отклонение определяется как средняя арифметическая индивидуальных абсолютных отклонений значений признака от его среднего значения.

Индивидуальные значения признака в статистической совокупности отклоняются от его средней величины в ту или иную сторону. Найдем среднюю меру отклонения каждого значения признака от его средней величины. Обозначим значения варьирующего признака у отдельных единиц совокупности через , где n – количество (число) единиц совокупности.

Вычитая из каждого значения признака его среднюю величину получим:

 

; ;... (6.2)

 

Так как алгебраическая сумма (сумма с учетом знака (±) величин) отклонений индивидуальных значений признака от средней арифметической (согласно нулевому свойству) всегда равна нулю, то для расчета среднего линейного отклонения используется арифметическая сумма (сумма модулей величин) отклонений, т.е. суммируются абсолютные значения индивидуальных отклонений значений признака независимо от знака.

Среднее линейное отклонение вычисляется для первичных, несгруппированных данных:

(6.3)

Для сгруппированных данных (интервальный ряд):

 

(6.4)

 

где хi – индивидуальное значение i -гo признака;

– центральное значение признака в i -ом интервале;

– среднее значение признака;

п - число единиц статистической совокупности;

fi – количество признаков в i -ом интервале;

m – количество интервалов в интервальном вариационном ряду.

 

Пример. Проведем расчет среднего линейного отклонения сменной выработки токарей механического цеха, данные о которой представлены в таблице 6.2.

 

Таблица 6.2

Сменная выработка токарей механического цеха завода

Количество деталей, обрабатываемых в смену одним рабочим, шт. (х) Число рабочих (f) х·f
         
         
         
         
         
ИТОГО:     -  

 

Вычисляем среднюю арифметическую:

Тогда среднее линейное отклонение составит:

Это означает, что в среднем сменная выработка каждого рабочего в изучаемой совокупности отклонялась от средней сменной выработки в целом по цеху на 0,75.

Среднее линейное отклонение – число всегда именованное. Его размерность соответствует размерности варьирующего признака.

Простота расчета и интерпретации результатов составляют положительные стороны данного показателя. Однако в результате абстрагирования от знака индивидуальных отклонений, возникают трудности в применении математических методов анализа вариации. Математические свойства модулей «плохие»: их нельзя поставить в соответствие с каким-либо вероятностным законом, в том числе и с нормальным распределением, наиболее часто ветречающимся в экономике, в технике, в жизни. По этой причине среднее линейное отклонение в настоящее время используют редко, но используют. Например, для оценки однородности толщины нитей и пряжи в текстильной промышленности.

Среднее квадратическое отклонение определяется как корень квадратный из среднего квадратов отклонений индивидуальных значений признака от средней арифметической и рассчитывается по следующим формулам:

для не сгруппированных данных:

(6.5)

для сгруппированных данных:

(6.6)

для интервального ряда:

(6.7)

Возведение индивидуальных отклонений в квадрат и последующее извлечение квадратного корня вызвано, как уже говорилось, тем, что суммирование отклонений в первой степени приводит к нулевому результату.

Среднее квадратическое отклонение является общепринятым показателем вариации: при его определении принимаются в расчет все отклонения значений варьирующего признака от среднего. Проиллюстрируем расчет среднего квадратического отклонения для ранжированного и интервального вариационных рядов.

Пример. Пусть испытываются шесть лампочек на продолжение горения. Результаты испытания представлены в табл. 6.3 (дискретный вариационный ряд).

 

Таблица 6.3

Результаты испытаний лампочек

Порядковый номер испытания Продолжительность горения лампочки, час (х,)
    +20  
       
    -25  
    +5  
    -10  
    +10  
ИТОГО:      

 

Рассчитаем среднюю арифметическую и среднее квадратическое отклонение:

Это означает, что в среднем продолжительность горения лампочки в изучаемой совокупности отклонялась от средней продолжительности в целом по совокупности на 14,3 часа.

Пример. Рассчитаем среднее квадратическое отклонение срока обращения облигаций. Исходные данные для расчета и промежуточные вычисления представлены в табл. 6.4 (интервальный вариационный ряд).

Рассчитаем среднюю арифметическую величину срока обращения акций и среднее квадратическое отклонение:

;

Таблица 6.4

Срок обращения облигаций

Срок обращения облигаций, мес (х) Количество облигаций, шт (f)
до 2       – 4,6 21,16 317,4
2 – 4       – 2,6 6,76 87,88
4 – 6       – 0,6 0,36 10,44
6 – 8       1,4 1,96 43,12
8 – 10       3,4 11,56 138,72
10 и более       5,4 29,16 262,44
ИТОГО:     71,40 860,00

 

В научной статистике широко используется показатель вариации, называемый дисперсией. Дисперсия – это средний квадрат отклонений индивидуальных значений признака от средней арифметической.

Дисперсия вычисляется по следующим формулам.

Для не сгруппированных данных:

 

. (6.8)

Для сгруппированных данных (дискретный ряд):

. (6.9)

Для интервального ряда:

. (6.10)

На дисперсии основаны практически все методы математической статистики.

Дисперсия и среднее квадратическое отклонение – наиболее широко применяемые показатели вариации. Объясняется это тем, что они входят в большинство теорем теории вероятности, служащих фундаментом математической статистики. Кроме того, дисперсия может быть разложена на составные элементы, позволяющие оценить влияние различных факторов, обуславливающих вариацию признака.

Рассмотренные ранее показатели вариации, за исключением дисперсии, выражались в единицах измерения варьирующего признака. Так, например, среднее квадратическое отклонение урожайности пшеницы измеряется в центнерах. Так как среднеквадратическое отклонение – число именованное, то оно неудобно для сопоставления вариации различных признаков. Например, вычислив среднее квадратическое отклонение производительности работы и заработной платы рабочих, невозможно определить, вариация какого признака больше, т.к в первом случае она измеряется в единицах продукции (деталях), во втором – в гривнях.

Для сравнения вариации разных признаков наиболее часто применяется показатель относительной колеблемости – коэффициент вариации. Его используют не только для сравнительной оценки вариации, но и для характеристики однородности статистической совокупности. Статистическая совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному закону).

Принцип построения коэффициентов вариации таков:

 

(6.11)

 

Линейный коэффициент вариации Квадратический коэффициент вариации   Коэффициент
(6.12)
осцилляции

 

Чаще всего на практике употребляется квадратический коэффициент вариации.

С помощью коэффициента вариации можно сравнивать размеры одного признака в нескольких совокупностях. Так, например, с помощью коэффициента вариации можно сравнивать вариацию срока службы станков на различных предприятиях, вариацию роста и веса населения в различных регионах страны.

Пример. Рассмотрим коэффициенты вариации срока службы электролампочек, выпускаемых на трех заводах. Исходные данные представлены в табл. 6.5.

 

Таблица 6.5

Срок службы электролампочек

 

Номер завода Средняя продолжительность горения лампочек, ч., (х) , %
    -100   10,20
    + 100   8,17
        9,07
ИТОГО-        

 

Вычислим среднюю арифметическую срока горения лампочек:

 

.

 

Вычислим среднее квадратическое отклонение:

 

.

 

Вычислим коэффициент вариации для каждого завода и занесем данные в таблицу. Наиболее низкий коэффициент вариации у электролампочек, выпускаемых на заводе № 2, что свидетельствует о большой однородности его продукции (в данном случае, однородности качества электролампочек).

Характеристики формы распределения.

Для получения приблизительного представления о форме распределения строят графики распределения (полигон и гистограмму). В практике статистических исследований приходится встречаться с самими различными распределениями. Однородные совокупности характеризуются как правило, одновершинными распределениями. Многовершинность свидетельствует о неоднородности изучаемой совокупности. В этом случае необходима перегруппировка данных с целью выделения более однородных групп.

Выяснение общего характера распределения предполагает оценку степени его однородности, а также исчисление показателей асимметрии и эксцесса. В симметричном распределении , а чем заметнее асимметрия, тем больше отклонение между характеристиками центра распределения .

Стандартное отклонение называется коэффициентом асимметрии:

 

. (6.13)

 

В случае правосторонней асимметрии As > 0, левосторонней – As < 0. Если
As < 0,25, считается, что ассиметрия низкая, если As0,5 – средняя, а при As > 0,5 – высокая.

 
 

 

 


Рис. 6.1. Симметрия распределения

 

 

Оценивание коэффициента асимметрии также может производиться на базе центрального момента распределения и вычисляется по формуле:

 

(6.14)

где μ3 – центральный момент третьего порядка: .

Алгебраически центральный момент распределения – это средняя арифметическая k-й степени отклонения индивидуальных значений признака от средней:

 

(6.15)

 

Очевидно, что момент второго порядка – это дисперсия, которая характеризует вариацию, моменты 3-го и 4-го порядков характеризуют соответственно ассиметрию и эксцесс.

Эксцесс распределения – степень сосредоточенности элементов совокупности около центра распределения. Показатель эксцесса (островершинности) рассчитывается по формуле:

, (6.16)

где μ4 – центральный момент четвертого порядка .

 
 

 


Рис. 6.2. Эксцесс распределения

 

Эксцесс может быть положительным и отрицательным. У островершинных распределений показатель эксцесса имеет положительный знак, а у плосковершинных – отрицательный знак. Предельным значением отрицательного эксцесса является значение Ех = – 2; величина положительного эксцесса является величиной бесконечной. В нормальном распределении и поэтому .



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-04-27 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: