Тема 5 Средние величины и показатели вариации




5.1 Понятие о средних величинах, условия их применения

5.2 Виды средних и способы их вычисления

5.2.1 Степенные средние

5.2.2 Структурные средние

5.3 Показатели вариации

5.4 Использование показателей вариации в анализе взаимосвязей

 

 

1. Понятие о средних величинах, условия их применения

 

Среди обобщающих показателей, которыми статистика характеризует изучаемые явления, одно из центральных мест занимают средние величины. Это объясняется тем, что статистика изучает совокупности по варьирующим (изменяющимся, колеблющимся) признакам, причем вариация проявляется в изменении количественных значений признака у отдельных единиц совокупности. Например, отличаются по отдельным работникам предприятия такие признаки как заработная плата, стаж работы, возраст, производительность труда и т.д. В этих условиях для получения обобщающей характеристики совокупности рабочих по названным признакам рассчитывают среднюю их величину.

Средней величиной в статистике называется обобщающий показатель, характеризующий типичный уровень явления в конкретных условиях места и времени, отражающий величину варьирующего признака в расчете на единицу качественно однородной совокупности.

Вычисление среднего – один из распространенных приемов обобщения; средний показатель отражает то общее, что характерно (типично) для всех единиц изучаемой совокупности, в то же время он игнорирует различия отдельных единиц. Средняя величина всегда обобщает количественную вариацию признака, т. е. в средних величинах погашаются индивидуальные различия единиц совокупности, обусловленные случайными обстоятельствами.

Средняя – это сводная характеристика закономерностей процесса в тех условиях, в которых он протекает. Для того, чтобы средний показатель был действительно типизирующим, он должен определяться не для любых совокупностей, а только для совокупностей, состоящих из качественно однородных единиц - это является основным условием научно обоснованного использования средних.

Средние, полученные для неоднородных совокупностей, будут искажать характер изучаемого общественного явления, фальсифицировать его, или будут бессмысленными. Так, если рассчитать средний уровень доходов взрослого населения какого-либо региона, то получится фиктивный средний показатель, поскольку для его исчисления использована неоднородная совокупность, включающая в себя пенсионеров, работников предприятий различных отраслей и сфер экономики, в которых уровень оплаты труда имеет существенные различия (промышленности, сельского хозяйства, строительства, образования, культуры, здравоохранения и др.). В таких случаях метод средних используется в сочетании с методом группировок, позволяющим выделить однородные группы, по которым и исчисляются типические групповые средние.

Вместе с тем при проведении макроэкономического анализа (на уровне государства или единой экономической системы) нельзя ограничиваться применением средних только для характеристики значений признаков в однородных по данному признаку совокупностях. В этом случае статистика использует так называемые системные средние, обобщающие неоднородные явления, например, средний валовой внутренний продукт государства на душу населения, средняя заработная плата занятых в экономике, средний реальный доход на душу населения, производительность общественного труда и т.п.

Каждая средняя характеризует изучаемую совокупность по какому-либо одному признаку, но для полной характеристики любой совокупности, описания ее типических черт и качественных особенностей нужна система средних показателей. Поэтому в практике отечественной статистики для изучения социально-экономических явлений и их полной характеристики, как правило, исчисляется система средних показателей. Так, например, показатели средней заработной платы оцениваются совместно с показателями средней выработки, фондовооруженности и энерговооруженности труда, степенью механизации и автоматизации работ и др.

Средняя должна вычисляться с учетом экономического содержания исследуемого показателя. Поэтому для конкретного показателя, используемого в социально-экономическом анализе, можно исчислить только одно истинное значение средней на базе научного способа расчета.

 

5.2 Виды средних и способы их вычисления

 

Выбор вида средней величины определяется экономическим содержанием определенного показателя и исходных данных. В статистическом анализе используются два класса средних величин: степенные средние и структурные средние.

 

5.2.1 Степенные средние

К классу степенных средних величин относятся: средняя арифметическая, средняя гармоническая, средняя геометрическая, средняя квадратическая, средняя кубическая.

Степенные средние в зависимости от представления исходных данных исчисляются в двух формах: простой и взвешенной. Простая средняя считается по несгруппированным данным и имеет следующий общий вид:

 

(5.1)

 

где xi – варианта (значение) осредняемого признака; m - показатель степени средней; n – число вариант.

Взвешенная средняя считается по сгруппированным данным, представленным в виде дискретных или интервальных рядов распределения:

(5.2)

где xi – варианта (значение) осредняемого признака или среднее значение интервала, в котором измеряется варианта; m - показатель степени средней; – fi частота, показывающая, сколько раз встречается i – e значение осредняемого признака.

 

В зависимости от значения показателя степени m различают следующие виды степенных средних:

при m = -1 — средняя гармоническая ;

при m = 0 — средняя геометрическая ;

при m = 1 — средняя арифметическая ;

при m = 2 — средняя квадратическая ;

при m = 3 — средняя кубическая .

При использовании одних и тех же исходных данных, чем больше m в формулах 5.1 и 5.2, тем больше значение средней величины:

(5.3)

Это свойство степенных средних возрастать с повышением показателя степени определяющей функции называется в статистике правилом мажорантности средних.

Характер имеющихся данных определяет существование только одного истинного среднего значения показателя. Вид средней выбирается в каждом отдельном случае путем конкретного анализа изучаемой совокупности, он определяется материальным содержанием изучаемого явления, а также принципами суммирования и взвешивания.

Остановимся подробнее на степенных средних.

Средняя арифметическая

Средняя арифметическая является наиболее распространенным видом средних величин, она применяется в тех случаях, когда объем варьирующего признака для всей совокупности является суммой значений признаков отдельных ее единиц. Чтобы исчислить среднюю арифметическую, нужно сумму всех значений признаков разделить на их число.

Средняя арифметическая применяется в форме простой средней и взвешенной средней. Исходной, определяющей формой, служит простая средняя арифметическая.

Средняя арифметическая простая применяется в тех случаях, когда исходные данные представляют собой несгруппированные индивидуальные значения признака, она определяется как отношение суммы отдельных значений осредняемого признака к общему числу этих значений:

(5.4)

где х12,..., хп — индивидуальные значения варьирующего признака (варианты);

п — число единиц совокупности.

Пример 5.1. Требуется найти среднюю выработку одного рабочего (слесаря), если известно, сколько деталей изготовил каждый из 15 рабочих, т.е. дан ряд индивидуальных значений признака, шт.:

21; 20; 20; 19; 21; 19; 18; 22; 19; 20; 21; 20; 18; 19; 20.

Средняя арифметическая простая рассчитывается по формуле (5.4), шт.:

 

Средняя арифметическая взвешенная применяется в тех случаях, когда исходные данные представляют собой сгруппированные значения признака, т.е. дискретный или интервальный вариационный ряд распределения, она рассчитывается по формуле:

(5.5)

где f1,f2,...,fn — веса (частоты повторения одинаковых признаков);

– сумма произведений величины признаков на их
частоты;

– общая численность единиц совокупности.

Пример 5.2. Технику вычисления средней арифметической взвешенной проиллюстрируем на рассмотренном выше примере 1. Для этого сгруппируем исходные данные, образовав дискретный ряд распределения (графа 1,2 таблицы 5.1).

 

Таблица 5.1 – Распределение рабочих по выработке деталей

Выработка деталей за смену одним рабочим, шт.,(х) Число рабочих (веса) (f)
     
     
Итого    

 

По формуле (5.5) средняя арифметическая взвешенная составит, шт.:

В отдельных случаях веса могут быть представлены не абсо­лютными величинами, а относительными (в процентах или долях единицы). Тогда формула средней арифметической взвешенной будет иметь вид:

(5.6)

где – частость (в процентах или долях единицы).

Иногда приходится исчислять среднюю по групповым сред­ним или по средним отдельных частей совокупности (частным средним), т.е. среднюю из средних. Средние из средних рассчитываются так же, как и средние из первоначальных значений признака. При этом средние, ко­торые служат для исчисления на их основе общей средней, при­нимаются в качестве вариантов.

Вычисление средней арифметической взвешенной из групповых средних осуществляется по формуле:

(5.7)

где f – число единиц в каждой группе.

Если расчет средней арифметической взвешенной осуществляется по интервальному ряду распределения, т.е. значения осредняемого признака заданы в виде интервалов («от — до»), вычислительные операции должны проводиться в следующем порядке:

- если в ряду распределения имеются открытые интервалы, их необходимо сделать закрытыми, при этом величины открытых интервалов (первый и последний) условно приравниваются к интервалам, примыкающим к ним (второй и предпоследний);

- от интервального ряда необходимо перейти к дискретному путем замены интервальных значений признака величиной середины интервала, т.е. их средними значениями (простая средняя между верхней и нижней границами каждого интервала);

- рассчитать среднюю арифметическую взвешенную по формуле 5.5

Пример 5.3. Рассчитаем средний уровень оплаты труда (среднюю заработную плату) работников по данным таблицы 5.2, графа 1,2.

В графах 3-5 реализованы расчетные процедуры, приведенные выше:

- в графе 3 открытые интервалы преобразованы в закрытые: до 15 (10-15); свыше 30 (30-35);

- в графе 4 рассчитаны середины интервалов;

- в графе 5 определены произведения вариантов на частоты ().

 

Таблица 5.2 – Распределение работников по уровню оплаты труда

Исходные данные Расчетные значения
Группы работников по оплате труда, тыс. руб. Число рабочих, чел., (f) Группы работников по оплате труда, тыс. руб. Середина интервала, руб. (x)
         
До 15   10-15 (10+15):2=12,5 12,5х4=50,0
15-20   15-20 (15+20):2=17,5 17,5х16=280,0
20-25   20-25 (20+25):2=22,5 22,5х29=652,5
25-30   25-30 (25+30):2=27,5 27,5х35=962,5
Свыше 30   30-35 (30+35):2=32,5 32,5х16=520,0
Итого   Итого - 2465,0

 

Рассчитаем средний уровень оплаты труда:

= 2465:100=24,65 тыс.руб.

Итак, средний уровень оплаты труда работников составляет 24,65 тыс. руб. в месяц.

Вычисление средней арифметической часто сопряжено с большими затратами времени и труда. Однако в ряде случаев процедуру расчета средней можно упростить и облегчить, если воспользоваться ее свойствами. Приведем (без доказательства) некоторые основные свойства средней арифметической.

Свойство 1. Если все индивидуальные значения признака (т.е. все варианты) уменьшить или увеличить в i раз, то среднее значение нового признака соответственно уменьшится или увеличится в i раз.

Свойство 2. Если все варианты осредняемого признака уменьшить или уве­личить на число А, то средняя арифметическая соответст­венно уменьшится или увеличится на это же число А.

Свойство 3. Если веса всех осредняемых вариантов уменьшить или увеличить в k раз, то средняя арифметическая не изменится.

Средняя гармоническая

Средняя гармоническая представляет собой среднюю из обратных варьирующих значений признака, она применяется в тех случаях, если неизвестна численность изучаемой совокупности.

Когда статистическая информация не содержит частот f по отдельным вариантам х совокупности, а представлена как их произведение w = x · f, применяется формула средней гармонической взвешенной:

(5.8)

 

где w1, w2, … wn значение осредняемого признака, взвешенное на их число, т.е. w = x · f;

Таким образом, средняя гармоническая применяется тогда, когда средняя предназначается для расчета сумм слагаемых, обратно пропорциональных величине данного признака, когда суммированию подлежат не сами варианты, а обратные им величины.

Пример 5.4. По данным (таблицы 5.3) требуется определить среднюю цену 1 кг яблок в апреле.

Средняя цена 1 кг яблок, (руб.), по трем коммерческим магазинам может быть исчислена по формуле (5.8) средней гар­монической взвешенной:

.

 

Таблица 5.3 - Цена и выручка от реализации по трем коммерческим магазинам

Номер магазина Исходные данные
    Цена яблок, руб., x Выручка от реализации, руб.,w
1-й 2-й 3-й    
Итого  

 

 

В тех случаях, когда вес каждого варианта равен единице (индивидуальные значения обратного признака встречаются по одному разу), применяется средняя гармоническая простая, исчисляемая по формуле:

(5.9)

где - отдельные варианты обратного признака, встречающиеся

по одному разу; п — число вариантов.

Для закрепления знаний по теме рассмотрим задачу на применение в расчетах средней арифметической и средней гармонической.

Пример 5.5. Требуется определить средний размер двух видов вклада в банке в октябре и ноябре по данным таблицы 5.4.

 

Таблица 5.4 – Информация о вкладах в банке для расчета средних значений

 

Вид вклада Октябрь Ноябрь
Число вкладов, тыс., f Средний размер вклада, тыс. руб., x Сумма вкладов, млн. руб., w Средний размер вклада, тыс.руб., x
До востребования Срочный     4,07 3,87  

 

В октябре для расчета среднего размера вклада по двум видам применяем формулу средней арифметической взвешенной, тыс. руб.:

Средний размер вклада в ноябре по двум их видам находим по формуле средней гармонической взвешенной, тыс. руб.:

.

Как отмечено ранее, к числу степенных средних относятся также средняя геометрическая, средняя квадратическая, средняя кубическая. Эти виды средних величин имеют относительно ограниченное применение в статистическом анализе и рассчитываются по формулам, представленным в таблице 5.5.

Таблица 5.5 – Методика расчета средней геометрической, средней квадратической и средней кубической

 

Вид средней величины Область применения Формула расчета
для несгруппированных данных для сгруппированных данных
Средняя геометрическая Расчет среднего размера признака, выраженного цепными относительными величинами динамики
Средняя квадратическая Расчет среднего размера признака, выраженного в квадратных единицах измерения
Средняя кубическая Расчет среднего размера признака, выраженного в кубических единицах измерения

 

5.2.2 Структурные средние

Особым видом средних величин являются структурные средние, которые применяются для изучения внутреннего строения и структуры рядов распределения значений признака.

К классу структурных средних относятся мода и медиана.

Мода (M0) - значение признака, наиболее часто встречающееся в ряду распределения.

Мода широко используется в статистической практике при изучении покупательского спроса, регистрации цен и т.п.

В дискретном вариационном ряду мода - это варианта, имеющая наибольшую частоту.

В интервальных рядах распределения с равными интервала­ми мода вычисляется по формуле:

(5.10)

где - нижняя граница модального интервала; — модальный интервал; , , - частоты в модальном, предыдущем и следующем за модальным интервалах (соответственно).

Модальный интервал определяется по наибольшей частоте.

Пример 5.6. Группировка предприятий по стоимости основных производственных фондов (ОПФ) представлена следующим распределением (таблица 5.6).

Таблица 5.6 – Распределение предприятий региона по стоимости основных производственных фондов (ОПФ)

 

Группы предприятий по стоимости ОПФ, млн. руб. Число предприятий,  
14-16 16-18 18-20 20-22 22-24  
Итого  

 

По данным таблицы 5.6 видно, что модальным является интервал: 18-20, т.к. он имеет наибольшую частоту.

Рассчитаем моду, млн. руб.:

Итак, модальным значением стоимости ОПФ предприятий является стоимость, равная 18,8 млн. руб.

Медиана (Ме) - это варианта, который находится в середине вариационного ряда. Медиана делит рад на две равные (по числу единиц) части — со значениями признака меньше медианы и со значениями признака больше медианы.

Чтобы найти медиану, необходимо отыскать значение признака, которое находится в середине упорядоченного рада. В ранжированных рядах несгруппированных данных нахождение медианы сводится к отысканию порядкового номера медианы.

Пример 5.7. Пусть ряд состоит из показателей цены товара в отдельных торговых точках города, руб.:

630, 650, 680, 690, 700, 710, 720, 730, 750.

Номер медианы для нечетного объема вычисляется по формуле:

(5.11)

где n — число значений признака в ряду распределения.

В нашем примере номер медианы равен 5, медиана равна 700 руб. (т.е. одна половина товара реализуется по цене менее 700 руб., а другая — более 700 руб.).

В случае четного объема ряда распределения медиана равна средней из двух вариантов, находящихся в середине ряда.

В интервальных рядах распределения медианное значение оказывается в каком-то из интервалов признака – в медианном интервале. Для определения медианного интервала необходимо определять накопленную (кумулятивную) частоту каждого последующего интервала до тех пор, пока она не превысит 1/2 суммы всех частот ряда. Значение медианы вычисляется по формуле:

(5.12)

где - нижняя граница медианного интервала; - величина медианного интервала; - половина от общего числа совокупности; - накопленная частота интервала, предшествующего медианному; -частота медианного интервала.

Пример 5.8. Рассчитаем медиану по данным табл. 5.6. Прежде всего, найдем медианный интервал. Таким интервалом, очевидно, будет интервал стоимости ОПФ предприятий (18-20 млн. руб.), поскольку его кумулятивная частота равна 18 (2+6+10), что превышает половину суммы всех частот (25: 2 = 12,5). Нижняя граница интервала 18 млн. руб., его частота 10; частота, накопленная до него, равна 8.

Подставив данные в формулу (5.12), найдем значение медианы, млн. руб.:

.

Полученный результат говорит о том, что из 25 предприятий региона 12 предприятий имеют стоимость ОПФ менее 18 млн. руб., а 12 предприятий - более.

Мода и медиана, как правило, отличаются от значения средней, совпадая с ней только в случае симметричного распределения частот вариационного ряда. Поэтому соотношение моды, медианы и средней арифметической позволяет оценить асимметрию ряда распределения.

Аналогично медиане вычисляются значения признака, делящие совокупность на четыре равные (по числу единиц) части — квартили, на пять равных частей - квинтили, на десять частей - децили, на сто частей — перцентили.

Использование в анализе вариационных рядов распределения рассмотренных выше характеристик позволяет более глубоко и детально охарактеризовать изучаемую совокупность.

 

5.3 Показатели вариации

Информация о средних уровнях исследуемых показателей обычно бывает недостаточной для полного анализа изучаемого процесса или явления. Иногда совершенно непохожие по своему внутреннему строению совокупности могут иметь равные средние величины. Поэтому для более детального изучения того или иного явления необходимо учитывать разброс или вариацию значений отдельных единиц совокупности.

Вариация — это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени. Например, работники фирмы различаются по доходам, затратам времени на работу, росту, весу, любимому занятию в свободное время и т.д.

Вариация возникает в результате того, что индивидуальные значения признака складываются под совокупным влиянием разнообразных факторов (условий), которые по-разному сочетаются в каждом отдельном случае.

Для оценки вариации в статистике применяют следующие показатели: размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение, коэффициент вариации.

Простейшим показателем вариации является размах вариации (R), который представляет собой разность между максимальным и минимальным значениями признака:

R =xmax - xmin

Недостатком данного показателя является то, что он оценивает только границы варьирующего признака и не отражает его колеблемость внутри этих границ. Вследствие этого размах вариации может неправильно характеризовать общую колеблемость признака.

Среднее линейное отклонение представляет собой среднюю арифметическую абсолютных значений отклонений отдельных вариантов от их средней арифметической, рассчитывается по формуле:

для несгруппированных данных: (5.13)

где п — число членов ряда;

для сгруппированных данных: (5.14)

где — сумма частот вариационного ряда.

Дисперсия признака (σ 2) представляет собой средний квадрат отклонений вариантов от их средней величины, она вычисляется по формулам простой и взвешенной дисперсий (в зависимости от исходных данных):

простая дисперсия для несгруппированных данных:

(5.15)

взвешенная дисперсия для сгруппированных данных:

(5.16)

Формула (5.15) применяется при наличии у вариантов своих весов (или частот вариационного ряда).

Формулу для определения дисперсии (5.15 и 5.16) можно преобразовать, учитывая, что , тогда расчет дисперсии может быть осуществлен по формуле:

σ 2 = (5.17)

где - для несгруппированных данных;

- для сгруппированных данных.

Тогда для сгруппированных данных формула дисперсии (5.17) имеет следующий вид:

(5.18)

т.е. дисперсия равна разности средней из квадратов вариан­тов и квадрата их средней.

Среднее квадратическое отклонение (σ) равно корню квадратному из дисперсии:

 

для несгруппированных данных: (5.19)

для сгруппированных данных: (5.20)

Для осуществления сравнений колеблемости одного и того же признака в нескольких совокупностях с различным средним арифметическим используют относительный показатель вариации — коэффициент вариации.

Коэффициент вариации представляет собой выраженное в процентах отношение среднего квадратического отклонения к средней арифметической:

(5.21)

Коэффициент вариации используют не только для сравнительной оценки вариации единиц совокупности, но и как характеристику однородности совокупности. Совокупность считается количественно однородной, если коэффициент вариации не превышает 33 %.

Пример 5.9. Результаты обследования показали следующее распределение работников торговли по стажу, представленное в таблице 5.7:

Таблица 5.7 - Распределение работников торговли по стажу работы

Стаж, лет Число работников, чел
до 6  
6 - 12  
12 - 18  
18 - 24  
св. 24  
ИТОГО  

На основании этих данных исчислить:

1) средний стаж работников торговли;

2) дисперсию и среднее квадратическое отклонение;

3) коэффициент вариации;

Средний стаж работников торговли для открытого интервального ранжированного ряда определим следующим образом.

Открытые интервалы сделаем закрытыми (графа 1 таблицы 5.8) и определим середины интервалов (графа 3 таблицы 5.8) по методике рассмотренной в вопросе 2.1 данной темы.

Рассчитаем средний стаж работников торговли по данным графы 3 таблицы 5.8 по формуле средней арифметической взвешенной:

года.

 

 

Таблица 5.8 – Вспомогательные расчеты для определения показателей вариации

Стаж, лет Число работн., f Середина интервала хf х - (х - )2 (х- )2 f
1 2 3 4 5 6 7
0 - 6   (0 + 6): 2 = 3 3х15 =45 (3-13,8) = -10,8 (3-13,8)2 =116,64 (3-13,8)2 х 15 = 1749,6
6 - 12       -4,8 23,04 576,0
12 - 18       1,2 1,44 50,4
18 - 24       7,2 51,84 777,6
24 - 30       13,2 174,24 1742,4
ИТОГО   -   - - 4896,0
  å f = 100   å хf =1380     =

Чтобы исчислить дисперсию по формуле продолжим расчет показателей в табл. 5.8 (графа 5 – 7). Итог графы 7 подставим в формулу для дисперсии:

(лет).

3. Среднее квадратическое отклонение исчислим по формуле:

(лет)

4. Коэффициент вариации определяется по формуле:

Вывод: проведенные расчеты коэффициента вариации свидетельствует, что уровень вариации стажа работы по изучаемой совокупности является относительно высоким (т.к. коэффициент вариации больше 33,3%). Другими словами совокупность является неоднородной в отношении анализируемого признака (стажа работы).

 

 

5.4 Использование показателей вариации в анализе взаимосвязей

 

Вариация признака обусловлена различными факторами, некоторые из этих факторов можно выделить, если статистическую совокупность разбить на группы по какому-либо признаку. В простейшем случае, когда совокупность расчленена на группы по одному фактору, изучение вариации достигается посредством исчис­ления и анализа трех видов дисперсий: общей, межгрупповой и внутригрупповой.

Общая дисперсия (σ2) измеряет вариацию признака по всей совокупности под влиянием всех факторов, обусловивших эту вариацию. Она равна среднему квадрату отклонений отдельных значений признака х от общей средней и может быть вычислена как простая дисперсия (по формуле (5.15) или взвешенная дисперсия по формуле (5.16).

Межгрупповая дисперсия (δ2) характеризует систематическую вариацию результативного признака, обусловленную влиянием признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений групповых (част­ных) средних от общей средней :

(5.22)

где f - численность единиц в группе.

Внутригрупповая (частная) дисперсия σ2i отражает случай­ную вариацию, т.е. часть вариации, обусловленную влиянием не­учтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений отдельных значений признака внутри группы х от средней арифметической этой группы xt (групповой средней) и может быть исчислена как простая дисперсия или как взвешенная дисперсия по формулам, соответственно:

(5.23)

(5.24)

 

На основании внутригрупповой дисперсии по каждой группе, т.е. на основании σ2i можно определить общую среднюю из внутригрупповых дисперсий:

(5.25)

Согласно правилу сложения дисперсий общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий:

(5.26)

Пользуясь правилом сложения дисперсий, можно всегда по двум известным дисперсиям определить третью — неизвестную, а также судить о силе влияния группировочного признака.

Очевидно, чем больше доля межгрупповой дисперсии в общей дисперсии, тем сильнее влияние группировочного признака (квалификационного разряда) на изучаемый признак (количество изготавливаемых изделий).

Поэтому в статистическом анализе широко используется эмпирический коэффициент детерминации (η2) — показатель, представляющий собой долю межгрупповой дисперсии в общей дисперсии результативного признака и характеризующий силу влияния группировочного признака на образование общей вариации:

(5.27)

Эмпирический коэффициент детерминации показывает долю вариации результативного признака у под влиянием факторного признака х (остальная часть общей вариации у обуславливается вариацией прочих факторов). При отсутствии связи эмпирический коэффициент детерминации равен нулю, а при функцио­нальной связи - единице.

Эмпирическое корреляционное отношение - это корень квадратный из эмпирического коэффициента детерминации:

(5.28)

η оно показывает тесноту связи между группировочным и результативным признаками.

Эмпирическое корреляционное отношение η, как и η2, может принимать значения от 0 до 1.

Если связь отсутствует, то корреляционное отношение равно нулю, т.е. все групповые средние будут равны между собой, межгрупповой вариации не будет. Значит, группировочный признак никак не влияет на образование общей вариации.

Если связь функциональная, то корреляционное отношение будет равно единице. В этом случае дисперсия групповых средних равна общей дисперсии (δ2 = σ2), т.е. внутригрупповой вариации не будет. Это означает, что группировочный признак целиком определяет вариацию изучаемого результативного признака.

Для качественной оценки тесноты связи на основе показателя эмпирического корреляционного отношения можно воспользоваться соотношениями Чэддока:

Таблица 5.9 – Шкала Чэддока

ηэ 0,1-0,3 0,3-0,5 0,5-0,7 0,7-0,9 0,9-0,99
Сила Слабая Умеренная Заметная Тесная Весьма
связи         тесная

 

Чем значение корреляционного отношения ближе к единице, тем теснее, ближе к функциональной зависимости связь между признаками.

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-04-02 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: