Методические рекомендации и решения типовых задач




ГЛАВА 5. Показатели вариации

Вариация – это изменение (колеблемость) значений признака в пределах изучаемой совокупности при переходе от одного объекта (группы объектов), или от одного случая к другому. Абсолютные и относительные показатели вариации, характеризующие колеблемость значений варьирующего признака, позволяют, в частности, измерить степень связи и взаимозависимости между признаками, определить степень однородности совокупности, типичности и устойчивости средней, определить величину погрешности выборочного наблюдения, статистически оценить закон распределения совокупности и т. п.

В этой теме необходимо уяснить сущность (смысл), назначение и способы вычисления каждого показателя вариации, рассматриваемого в курсе теории статистики: размах вариации, среднее линейное отклонение, средний квадрат отклонений (дисперсию), среднее квадратическое отклонение, относительные коэффициенты вариации (коэффициент осцилляции, коэффициент среднего линейного отклонения, коэффициент вариации).

Размах вариации (R) представляет собой разность между максимальным (хmax) и минимальным (хmin) значениями признака в совокупности (в ряду распределения):

R = хmax - хmin. (5.1)

Мерой других показателей вариации является разность не между крайними значениями признака, а средняя разность между каждым значением признака и средней величиной этих признаков. Разность между отдельным значением признака и средней называют отклонением.

Среднее линейное отклонение вычисляется по следующим формулам:

по индивидуальным (несгруппированным) данным

; (5.2)

по вариационным рядам (сгруппированным данным)

. (5.3)

Так как алгебраическая сумма отклонений индивидуальных значений признака от средней (согласно нулевому свойству) всегда равна нулю, то при расчете среднего линейного отклонения используется арифметическая сумма отклонений, взятая по модулю, т.е. .

Среднее линейное отклонение имеет ту же размерность, что и признак, для которого оно исчисляется.

Дисперсия и среднее квадратическое отклонение. Среднее линейное отклонение относительно редко применяется для оценки вариации признака. Поэтому обычно вычисляются дисперсия (s2) и среднее квадратическое отклонение (s). Эти показатели применяются не только для оценки вариации признака, но и для измерения связи между ними, для оценки величины ошибки выборочного наблюдения и других целей.

Дисперсия признака рассчитывается по формулам:

по первичным данным

; (5.4)

по вариационным рядам

. (5.5)

Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии:

по первичным данным

; (5.6)

по вариационным рядам

. (5.7)

Среднее квадратическое отклонение так же, как и среднее линейное отклонение, имеет ту же размерность, что и сам исходный признак.

Дисперсию можно определить и как разность между средним квадратом вариантов и квадратом их средней величины, т. е. . (5.8)

В этом случае по первичным данным дисперсия равна:

(5.9)

Применительно к сгруппированным данным, расчет дисперсии этим способом в развернутом виде представим в таком виде:

. (5.10)

Для рядов распределения с равными интервалами значение дисперсии можно вычислить, применяя способ условных моментов, т. е.

, (5.11)

где - первый условный момент; (5.12)

- второй условный момент. (5.13)

Среднее квадратическое отклонение по способу условных моментов определяется по формуле:

(5.14)

Преобразуя выражение расчета дисперсии по способу условных моментов, получим формулу вида: (5.15)

На основе одних и тех же исходных данных получим одинаковое значение дисперсии.

Относительные показатели вариации вычисляются как отношение ряда абсолютных показателей вариации к их средней арифметической и выражаются в процентах:

коэффициент осцилляции - ; (5.16)

коэффициент относительного линейного отклонения - ; (5.17)

коэффициент вариации - . (5.18)

Задача 1. Рассмотрим способы расчета показателей вариации на основе данных табл. 5.1.


Таблица 5.1. Исходные данные для расчета показателей вариации

Затраты времени на производство деталей мин Количество деталей, шт. (f) Середина интервала (х) xf х2 х2f
                         
до 10       -4,2   17,64 176,4     -2 -20  
10-12       -2,2   4,84 48,4     -1 -10  
12-14       -0,2   0,04 2,0          
14-16       1,8   3,24 64,8          
16 и выше       3,8   14,44 144,4          
Итого   -   -   -   -        

 

 

; к = 2

 


Приведенный ряд распределения ранжированный, поэтому здесь легко найти минимальное значение признака, оно равно 8 мин. (10 - 2), и максимальное, равное 18 мин. (16 + 2). Значит, размах вариации признака в этом ряду составит 10 мин., т. е.

R = xmax – xmin = 18 – 8 = 10 мин.

Вычислим среднее линейное отклонение. Прежде всего необходимо вычислить среднюю величину . Все вычисления будем вести в табличной форме (табл. 5.1.), отводя для каждой вычислительной операции графу в таблице.

Поскольку исходные данные представлены рядом распределения, то

мин.

мин.

Покажем способы расчета дисперсии:

а) обычным способом (по определению):

;

б) как разность между средним квадратом и квадратом средней величины:

Для определения величины дисперсии по этой формуле необходимо вычислить средний квадрат вариантов признака по формуле:

;

s2=178,6 – (13,2)2=4,36;

в) по способу условных моментов:

;

;

.

г) на основе преобразования формулы расчета дисперсии по способу условных моментов имеем:

Дисперсия – число отвлеченное, не имеющее единиц измерения.

Среднее квадратическое отклонение вычислим путем извлечения корня квадратного из дисперсии:

мин.

По способу условных моментов величину среднего квадратического отклонения определим так:

мин.

Вычислим относительные показатели вариации:

%;

%;

%.

Основным относительным показателем вариации является коэффициент вариации (V). Он используется для сравнительной оценки меры колеблемости признаков, выраженных в различных единицах измерения.

Наряду с вариацией количественных признаков может наблюдаться и вариация качественных признаков (в частности альтернативной изменчивости качественных признаков). В этом случае каждая единица изучаемой совокупности либо обладает каким-то свойством, либо нет (например, каждый взрослый человек либо работает, либо нет). Наличие признака у единиц совокупности обозначают 1, а отсутствие –0; долю же единиц совокупности, обладающих изучаемым признаком, обозначают p, а не обладающих им – q. Дисперсия альтернативного признака определяется по формуле:

; (5.19)

p + q = 1 (5.20)

Если, например, доля поступивших в университет равна 30%, а не поступивших – 70%, то дисперсия равна 0,21(0,3 · 0,7). максимальное значение произведения pq равно 0,25 (при условии, когда одна половина единиц обладает данным признаком, а другая половина нет: (0,5 · 0,5 = 0,25).

Способ разложения общей дисперсии. Для оценки влияния различных факторов, определяющих колеблемость индивидуальных значений признака, воспользуемся разложением общей дисперсии на составляющие: на так называемую групповую дисперсию и среднюю из внутригрупповых дисперсий:

, (5.21)

где – общая дисперсия, характеризующая вариацию признака как результат влияния всех факторов, определяющих индивидуальные различия единиц совокупности.

Вариацию признака, обусловленную влиянием фактора, положенного в основу группировки, характеризует межгрупповая дисперсия d2, которая является мерой колеблемости частных средних по группам вокруг общей средней и исчисляется по формуле:

, (5.22)

где nj – число единиц совокупности в каждой группе;

j – порядковый номер группы.

Вариацию признака, обусловленную влиянием всех прочих факторов, кроме группировочного (факторного), характеризует в каждой группе внутригрупповая дисперсия:

, (5.23)

где i – порядковый номер x и f в пределах каждой группы.

По совокупности в целом средняя из внутригрупповых дисперсий определяется по формуле:

(5.24)

Отношение межгрупповой дисперсии d2 к общей даст коэффициент детерминации:

(5.25)

который характеризует долю вариации результативного признака, обусловленную вариацией факторного признака, положенного в основание группировки.

Показатель, полученный как корень квадратный из коэффициента детерминации, называется коэффициентом эмпирического корреляционного отношения, т.е.:

(5.26)

Он характеризует тесноту связи между результативным и факторным (положенным в основу группировки) признаками. Численное значение коэффициента эмпирического корреляционного отношения имеет два знака: ±. При решении вопроса о том, с каким знаком его следует брать, необходимо иметь ввиду: если вариация факторного и результативного признаков идет синхронно в одном и том же направлении (возрастает или убывает), то корреляционные отношение берется со знаком плюс; если же изменение этих признаков идет в противоположных направлениях, то оно берется со знаком минус.

Для вычисления групповых и межгрупповых дисперсий можно применять любой из описанных выше способов исчисления среднего квадрата отклонений.

Задача 2. Вычислим все названные дисперсии по исходным данным табл. 5.2.

Таблица 5.2. Распределение посевной площади озимой пшеницы по урожайности

Номер участка Урожайность, ц/га (х) Посевная площадь, га (f) xf x2 x2f
           
           
           
           
           
           
           
           
           
Итого       x  

Вычислим среднюю урожайность озимой пшеницы по всем участкам (общая средняя):

ц/га.

Общую дисперсию найдем по формуле:

В гр. 6 табл. 5.2. вычислим значения для расчета среднего квадрата вариантов признака:

.

Находим общую дисперсию:

Урожайность зависит от многих факторов (качество почвы, размер внесения органических и минеральных удобрений, качество семян, сроки сева, уход за посевами и др.) Общая дисперсия в данном случае измеряет колеблемость урожайности за счет всех факторов.

Задача 3. Разобьем совокупность участков на две группы: I группа – посевные площади, на которых не вносились органические удобрения; II – площади, на которых они вносились. К первой группе отнесем участки 1-4, а ко второй – 4-8. По данным этих групп рассчитаем остальные из необходимых нам дисперсий, используя уже произведенные в табл. 5.2. вычисления.

 

 

Таблица 5.3. Расчетные данные для вычисления межгрупповой и групповых дисперсий

Номер участка Урожайность, ц/га (х) Посевная площадь, га (f) xf x2 x2f Номер участка Урожайность, ц/га (х) Посевная площадь, га (f) xf x2 x2f
                       
                       
                       
                       
Итого       x   Итого       x  

Определяем:

для I группы: для II группы:
а) групповую среднюю а) групповую среднюю
ц/га; ц/га;
б) средний квадрат вариантов признака б) средний квадрат вариантов признака
; ;
в) групповую дисперсию в) групповую дисперсию
. .

Определяем среднюю из групповых дисперсий:

.

Находим межгрупповую дисперсию:

.

Средняя из групповых дисперсий измеряет колеблемость признака за счет всех прочих факторов, кроме положенного в основание группировки (разграничения на группы), а межгрупповая – за счет именно этого фактора. Сумма этих дисперсий должна дать общую дисперсию, а именно:

Отношение межгрупповой дисперсии к общей в нашем примере даст следующее значение коэффициента детерминации:

, или 71,8%,

т. е. вариация урожайности озимой пшеницы на 71,8% зависит от вариации размеров внесения органических удобрений. Остальные же 28,2% вариации урожайности зависит от влияния всех остальных факторов, кроме размеров внесения органических удобрений.

Коэффициент эмпирического корреляционного отношения составит:

.

Это говорит о том, что внесение органических удобрений оказывает весьма существенное влияние на урожайность.

Статистические характеристики асимметрии и эксцесса. Выяснение общего характера распределения предполагает оценку степени его однородности, а также вычисление показателей асимметрии и эксцесса.

Величина показателя асимметрии может быть положительной (правосторонняя асимметрия) и отрицательной (левосторонняя асимметрия). Существует следующее соотношение между показателями центра распределения: при правосторонней асимметрии - ; при левосторонней асимметрии - .

Коэффициент асимметрии исчисляется по формуле:

, (5.27)

где М3 – центральный момент третьего порядка, который в вариационных интервальных рядах с равновеликими интервалами определяется через систему условных моментов по выражению:

. (5.28)

Значение s в системе стандартных условных моментов исчисляется по формуле:

. (5.29)

Оценка степени существенности показателя асимметрии дается с помощью его среднеквадратической ошибки:

. (5.30)

Если отношение , асимметрия существенна, и распределение признака в генеральной совокупности не является симметричным. Если отношение , асимметрия несущественна, ее наличие может быть объяснено влиянием случайных обстоятельств.

Для симметричных распределений рассчитывается показатель экцесса (островершинности):

. (5.31)

Четвертый центральный момент (М4) вычисляется по уравнению:

М4 = m4 – 4m3m1 + 6m2m21 – 3m41. (5.32)

Средняя квадратическая ошибка эксцесса рассчитывается по формуле

(5.33)

Если отношение , то следует предложить, что эксцесс свойствен распределению признака в генеральной совокупности и наоборот.

Задача 4. Покажем способы расчета коэффициентов асимметрии и эксцесса по данным табл. 5.4.

Таблица 5.4. Исходные данные для вычисления коэффициентов асимметрии и эксцесса

Затраты времени производство детали, мин.   Количество деталей, шт. (f) Середина интервала, (х)
               
до 10     -2 -20   -80  
10-12     -1 -10   -10  
12-14              
14-16              
16 и              
Итого   x x        

Вычислим значения условных моментов:

На основе комбинации первого, второго и третьего условных моментов исчислим третий центральный момент:

М3 = 0,1-3´1,1´0,1+2´(0,1)3=-0,228.

Значение среднего квадратического отклонения вычислим по формуле:

Определим коэффициент асимметрии:

.

Наличие знака минус при коэффициенте свидетельствует о левосторонней асимметрии.

Вычислим величину средней квадратической ошибки коэффициента асимметрии:

.

Критерий tAS вычислим по формуле:

.

Поскольку tAS < 3, то это свидетельствует о несущественности асимметрии распределения деталей по затратам времени на их изготовление.

Для расчета коэффициента эксцесса вычислим значение четвертого центрального момента:

М4 = 3,5 – 4 ´ 0,1 ´ 0,1 + 6 ´ 1,1 (0,1)2 – 3(0,1)4 = 3,5256.

Определим коэффициент эксцесса:

Величина среднеквадратической ошибки эксцесса составит:

Критерий tЕХ определим по формуле:

Так как tEX < 3, то наличие эксцесса не свойственно распределению признака в генеральной совокупности.

 


Задачи

Задача 5.1. Имеются следующие данные об уровнях месячной заработной платы рабочих в двух бригадах, тыс. ден. ед.

№ п/п № рабочего                    
Бригада № 1 4,0 4,2 4,7 4,9 4,5 5,2 6,0 6,1 5,8 4,6
Бригада № 2 3,6 4,8 5,2 7,0 4,2 5,0 6,2 4,0 4,5 5,5

Вычислите по этим данным:

1) вариационный размах;

2) среднее линейное отклонение;

3) дисперсию: а) по обычной формуле; б) по формуле ;

4) среднее квадратическое отклонение;

5) коэффициент осцилляции;

6) коэффициент среднего линейного отклонения;

7) коэффициент вариации.

Сделайте вывод, в какой из бригад вариация (различия) уровней заработной платы рабочих выше?

Задача 5.2. Распределение хозяйств района по уровню урожайности ячменя характеризуется следующими данными:

Группы хозяйств по урожайности ячменя, ц/га до 26 26-30 30-34 34-38 38 и выше
Посевная площадь, процент к итогу 10,0 25,0 35,0 20,0 10,0

Определить: 1) средний уровень урожайности ячменя:

а) обычным способом;

б) по способу условного момента;

2) вариационный размах;

3) дисперсию:

а) обычным способом;

б) по способу условных моментов;

4) среднее квадратическое отклонение;

5) среднее линейное отклонение;

6) значение медианы, первой и третьей квартильных характеристик;

7) квартильное отклонение (Q);

8) коэффициент осцилляции;

9) коэффициент среднего линейного отклонения;

10) коэффициент вариации;

11) относительный показатель квартильной вариации;

Задача 5.3. Распределение рабочих механического завода по длительности производственного стажа характеризуются следующими данными:

Группы рабочих по стажу работы, лет до 4 4-8 8-12 12-16 16-20 20 и более
Число рабочих, чел.            

Определите те же статистические характеристики, что и в задаче 5.2.

Задача 5.4. Имеются следующие данные о распределении заводов города по стоимости основных фондов:

Группы заводов по стоимости основных фондов, млрд. р. до 8 8-12 12-16 16-20 20-24 24 и более
Число заводов, процент к итогу            

Определите те же статистические характеристики, что и в задаче 5.2.

Задача 5.5. Имеются следующие данные о распределении коров по дневному надою молока:

Группы коров по дневному надою молока, кг до 10 10-14 14-18 18-22 22 и более Итого
Число коров            

Определите:

1) средний дневной надой молока на одну корову:

а) обычным способом;

б) по способу условного момента;

2) вариационный размах;

3) дисперсию:

а) обычным способом;

б) по способу условных моментов;

в) по формуле ;

г) по формуле ;

4) среднее квадратическое отклонение;

5) среднее линейное отклонение;

6) значение медианы, первой и третьей квартильных характеристик;

7) квартильное отклонение (Q);

8) коэффициент осцилляции;

9) коэффициент среднего линейного отклонения;

10) коэффициент вариации;

11) относительный показатель квартильной вариации;

12) коэффициенты асимметрии и эксцесса и характеристики оценки их значимости;

13) постройте гистограмму ряда распределения, а также графическое изображение моды и медианы;

14) вычислите теоретические (выровненные) значения частот по закону нормального распределения и подтвердите значимость распределения по критерию согласия Колмогорова и по критерию при = 0,05.

Задача 5.6. Удельный вес основных рабочих в трех цехах предприятия составил 80, 75 и 90%. Определите дисперсию и среднее квадратическое отклонение основных рабочих по каждому цеху в отдельности. Можно ли на основе данных этой задачи определить дисперсию удельного веса основных рабочих в целом по предприятию? Если нет, объясните, почему?

Задача 5.7. Используя данные предыдущей задачи, определите дисперсию и среднее квадратическое отклонение доли основных рабочих по всему предприятию в целом, если численность всех рабочих этих трех цехов составила соответственно 200, 300, 500 человек.

Задача 5.8. Число основных рабочих в трех цехах предприятия составляет 160, 210, и 450 рабочих, а число всех рабочих соответственно 200, 300, и 500 человек. Определите дисперсию и среднее квадратическое отклонение доли основных рабочих по каждому цеху в отдельности и по предприятию в целом. В каких случаях дисперсия альтернативного признака будет наибольшей?

Задача 5.9. По каждому из трех цехов ткацкой фабрики сменная выборка суровых тканей в среднем на одну ткачиху характеризуется следующими данными:

Номер цеха Средняя выработка ткани за смену на одну ткачиху, м2 Число тканей
     
     
     

Вычислите: 1) средний уровень размера сменной выработки ткани на одну ткачиху по фабрике в целом; 2) среднее квадратическое отклонение: а) обычным способом; б) по формуле ; 3) коэффициент вариации.

 

Задача 5.10. Имеются следующие данные по группе предприятий:

Показатель Среднее значение признака Дисперсия признака
Средняя заработная плата на одного рабочего, тыс. ден. ед. 6,0 0,81
Средний размер основных фондов, млн. ден. ед.    
Средняя списочная численность рабочих, чел.    

Дайте сравнительную характеристику вариации по каждому из статистических показателей и сделайте соответствующие выводы.

Задача 5.11. На основе приведенных данных сделайте вывод, по какому из показателей значение асимметрии является наибольшим.

Показатель Среднее значение признака Значение медианы Среднее квадратическое отклонение
Надой молока, кг      
Яйценоскость кур, шт.      
Выход мяса на 100 га сельхозугодий, ц      

 

Задача 5.12. Месячная заработная плата рабочих в зависимости от их квалификации характеризуется следующими данными:

Тарифный разряд рабочих Число рабочих Уровень месячной заработной платы каждого рабочего, тыс. ден. ед.
    3,0; 3,5; 4,0; 4,5; 5,0
    3,5; 4,0; 4,5; 5,0; 6,5; 6,0; 5,5
    4,0; 5,0; 4,5; 6,0; 6,5; 6,5; 7,5; 8,0

На основе приведенных данных вычислите:

1) среднюю месячную заработную плату по каждой из групп, выделенных по тарифному разряду рабочих;

2) среднюю месячную заработную плату по всей совокупности рабочих;

3) общую дисперсию заработной платы;

4) внутригрупповые (остаточные) дисперсии месячной заработной платы по каждой из групп, выделенных по тарифному разряду рабочих;

5) среднюю из внутригрупповых дисперсий;

6) значение всех дисперсий (общей и внутригрупповых) вычислите по формуле ;

7) межгрупповую дисперсию;

8) проверьте правило сложения дисперсий;

9) эмпирические коэффициенты детерминации и коэффициент корреляционного отношения.

Поясните содержательный смысл исчисленных коэффициентов.

Задача 5.13. Дисперсия месячной выработки рабочих – мужчин составила 1800, а работниц – 1500. Число рабочих мужчин составила 800 чел., а работниц – 200 чел. Общая дисперсия месячной выработки всех рабочих определена величиной 6640.

Определите 1) среднюю из групповых дисперсий; 2) межгрупповую дисперсию; 3) коэффициенты детерминации и эмпирического корреляционного отношения.

Задача 5.14. Средняя месячная заработная плата слесарей составила 5,2 тыс. ден. ед., а фрезеровщиков – 6,5 тыс.ден. ед. Число слесарей составило 80 чел., а фрезеровщиков – 120 чел. Общая дисперсия среднемесячной заработной платы всех рабочих достигла 1,216.

Определите: 1) межгрупповую дисперсию; 2) внутригрупповую дисперсию; 3) коэффициенты детерминации и эмпирического корреляционного отношения.

Задача 5.15. Имеются следующие данные о распределении рабочих машиностроительного завода по уровню месячной заработной платы с учетом длительности их производственного стажа:

Группы рабочих по уровню месячной з/пл., тыс. ден. ед. Всего рабочих завода В том числе со стажем, лет
до 5 5-10 свыше 10
до 3      
3,0 – 3,6        
3,6 – 4,2        
4,2 – 4,8        
4,8 – 5,4        
5,4 – 6,0      
6,0 и выше    
Итого        

Вычислите: 1) среднюю месячную заработную плату для всех рабочих завода и в разрезе по длительности стажа рабочих; 2) общую дисперсию и дисперсии по каждой из групп, среднюю из частных дисперсий и межгрупповую дисперсию; 3) используя исчисленные показатели, проверьте правило сложения дисперсий; 4) эмпирические значения коэффициентов детерминации и корреляционного отношения.

Поясните смысл исчисленных коэффициентов.

Задача 5.16. Имеются следующие данные о распределении посевов зерновых культур на удобренных и не удобренных участках:

Распределение посевов по урожайности зерновых, ц/га Вся посевная площадь зерновых, га в том числе
на удобренных участках, га не удобренных участках, га
до 20    
20 – 24    
24 – 28      
28 – 32      
32 – 36      
36 – 40      
40 –44    
44 и выше    
Итого      

Определите: среднюю урожайность по всей посевной площади и по отдельным участкам (удобренным и неудобренным); 2) общую дисперсию, дисперсии по каждому участку, среднюю из групповых дисперсий и межгрупповую дисперсию; 3) проверьте правило сложения дисперсий; 4) эмпирические коэффициенты детерминации и эмпирического корреляционного отношения.

Сделайте содержательные выводы на основе исчисленных коэффициентов.

Задача 5.17. На основе данных, приведенных в таблице, определите дисперсию доли сортовых посевов зерновых культур по каждому их трех хозяйств и среднюю из внутригрупповых дисперсий, общую и межгрупповую дисперсии доли сортовых посевов зерновых культур:

Номера хозяйств п/п Вся посевная площадь зерновых культур, га Площадь зерновых культур занятых сортовыми посевами, га
     
     
  10 000  

На основе исчисленных показателей проверьте правило сложения дисперсий доли признака.

Задача 5.18. Имеются следующие данные об общей численности работающих и численности работающих со средним специальным и высшим образованием по четырем заводам объединения:

№ завода п/п Общая численность работающих, чел. Число работающих, имеющих среднее и высшее образование, чел.
     
     
     
     

Определите: 1) долю работающих со среднем специальным и высшим образованием по каждому заводу и в целом по объединению; 2) общую дисперсию доли работающих со средним специальными и высшим образованием, дисперсии доли признака по каждому из предприятий и среднюю из внутригрупповых дисперсий, межгрупповую дисперсию доли признака.

Проверьте правило сложения дисперсий доли признака.

Задача 5.19. По приведенным ниже данным определите по предприятию в целом: 1) среднюю из внутригрупповых (внутрицеховы



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2018-03-19 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: