ХАРАКТЕРИСТИКИ ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ РАСПРЕДЕЛЕНИЯ




К показателям центра распределения относятся: среднее значение признака в совокупности, мода и медиана. Все показатели центра распределения характеризуют центральную тенденцию в изучаемом распределении, т.е. отражают характерный (типичный) уровень признака в конкретной совокупности, однако каждый из показателей несет и свою особую аналитическую информацию.

Анализ распределений предполагает изучение статистических совокупностей достаточно большого объема, согласно условиям действия ЗБЧ. Возникает необходимость получить характеристику всего набора данных с помощью использования какого - то одного обобщающего показателя. Таким показателем, который характеризует совокупность в целом, отражая типический уровень признака в изучаемой совокупности, является средняя арифметическая величина. По не сгруппированным данным среднее значение рассчитывается по формуле средней арифметической простой, по сгруппированным данным (на основе таблицы распределения) –как средняя арифметическая взвешенная (формулы расчета были рассмотрены в первом модуле).

В качестве весов в формуле средней арифметической взвешенноймогут быть использованы как частоты, так и частости. Если средняя величина рассчитывается по интервальному вариационному ряду, то в качестве индивидуальных значений признака принимаются значения, соответствующие середине каждого интервала. Предполагается, что внутри групп присутствует равномерное распределение единиц.

На основе данных таблицы 2.7 рассчитаем среднее значение денежных доходов населения регионов России:

Мода (M0) – наиболее часто встречающееся значение признака в совокупности. По интервальному вариационному ряду мода находится расчетным путем. Для нахождения значения моды сначала определяется модальный интервал. Модальным считается интервал, которому соответствует максимальная частота (в таблице 2.7. – это второй интервал с частотой 33). Затем,по приведенной ниже формуле, рассчитывается значение моды:

, (2.1)

где - нижняя граница модального интервала; h – величина группировочного интервала; - частота модального интервала; - частота интервалов, предшествующего и следующего за модальным.

Приведем расчет значения моды по данным таблицы распределения 2.7.

Таким образом, для значительного числа регионов России в 2013 году характерный (типический) уровень СДДД населения был близок к 20174 рублей на человека.

Медиана ( Ме) - значение признака у единицы, стоящей в центре ранжированного ряда, т.е. делящей ряд на две равные части. При определении медианы по не сгруппированным данным порядковый номер единицы, значение признака которой является медианой, определяется как . Если число единиц совокупности четное и порядковый номер – дробное значение (например, (70+1)/2=35,5), то значение медианы определяется как среднее арифметическое значений признака у двух центральных единиц (под номерами 35 и 36).

Расчет медианы по интервальному вариационному ряду реализуется следующим образом: по графе накопленных частостей (частот) определяется медианный интервал - это первый интервал, в который попадает 50 % единиц изучаемой совокупности, затем по следующей формуле рассчитывается значение медианы:

, (2.2)

где – нижняя граница медианного интервала; h - величина группировочного интервала; - сумма частот всех интервалов (объем совокупности); - накопленная частота интервала, предшествующего медианному; - частота медианного интервала. В рассматриваемом примере значение медианы, рассчитанное по таблице распределения, составит:

Далее представим значения характеристик центральной тенденции распределения регионов России по величине СДДН, полученные в программе STATISTICA, см. таблицу 2.8. Следует обратить внимание на закономерное расхождение значений показателей, рассчитанных с использованием программы и на основе построенной таблицы распределения. Несовпадение обусловлено тем, что в программе вычисления проводятся по не сгруппированным данным, а формулы применялись к сгруппированным данным (к интервальному вариационному ряду).

Таблица 2.8 - Показатели центральной тенденции распределения регионов России по величине СДДН в 2013 г.

 

О чем говорят полученные значения показателей? Среднее значение: в 2013 году в регионах России средний уровень денежные доходы населения составлял около 21934 рублей в месяц, однако модальное значение ниже среднего. В данном случае величину 20061 руб. в месяц можно интерпретировать следующим образом - это уровень дохода, вокруг которого наблюдается максимальная концентрация регионов, т.е. 33 региона или более 42 процентов регионов (см. таблицу 2.7). Что касается величины медианы, то она соответствует среднему уровню дохода в регионе, который стоит в центре ранжированного ряда. Более весомую смысловую нагрузку этот показатель несет как показатель структуры, о чем речь чуть позже.

Ответ на вопрос, какой характеристики центра распределения отдать предпочтение в рамках конкретного практического исследования, зависит от типа показателя, по которому построен ряд распределения, а также от цели исследования. Если показатель количественный, то могут быть рассчитаны все характеристики центра распределения: и средняя величина, и мода, и медиана. Тогда выбор предпочтения зависит от цели исследования и характера изучаемого распределения. Если распределение соответствует нормальному (симметричному), то целесообразно ориентироваться на среднее значения признака в совокупности. Приоритет средней величины обусловлен тем, что при ее расчете, в отличие от моды и медианы, учитываются значения показателя всех единиц совокупности. Если в распределении наблюдается существенная асимметрия, то предпочтение следует отдать моде или медиане, исходя из целей анализа.

При изучении распределений по атрибутивным признакам (форма собственности, организационно-правовая форма, уровень образования, национальность, и т.п.) средняя величина не может быть рассчитана. Медиана может быть определена только для ряда, построенного по порядковому атрибутивному признаку, т.е. поддающемуся ранжированию, например: уровень образования, должность. Если признаки измерены по номинальной шкале, то может быть определен только показатель моды: распределение населения города по национальности, распределение организаций по формам собственности (см. таблицу 2.9) и т.п.

Таблица 2.9 - Распределение организаций СПБ по формам собственности, проценты

Форма собственности 2005 г. 2012 г.
Всего,в т.ч.    
государственная 2,2 1,5
муниципальная 0,2 0,1
общественных и религиозных организаций 3,4 1,6
частная 88,2 91,9
смешанная российская 1,6 0,5
иностранных юридических лиц и иностранных граждан 1,9 2,6
совместная российская и иностранная 2,4 1,7
прочие 0,1 0,1

 

По представленным данным можно определить только показатель моды - это частная форма собственности, поскольку ей соответствует максимальная доля (частость).

Показатели структуры распределения: медиана, квартили, децили и прочие перцентили (процентили).

Медиана, как значение показателя у единицы совокупности, делящей ранжированный ряд пополам, одновременно является характеристикой и структуры распределения. Значение медианы указывает, что 50% единиц совокупности имеют значения признака меньше медианного и 50% - больше медианного. На какой половинесделатьакцент в аналитических выводах конкретного исследования, зависит от сути характеризуемого процесса (объекта). Если, например, изучается распределение регионов России по показателю обеспеченности населения жильем и значение медианы - 19 кв.м./чел., то, вероятно, следует указать, что в 50% регионов значение показателя ниже данного уровня. Если же изучается распределение по показателю детской смертности, в этом случае, очевидно, нужно сделать акцент на другой половине распределения, т.е. на тех регионах, в которых значение показателя выше медианного. При изучении, например, цен конкурентов на аналогичные для организации товары, выбор, на какой половине ряда распределения сделать акцент, зависит от уровня цен самой организации и от ее стратегии на рынке. В любом случае информация о величине медианы будет весьма полезна при принятии управленческих решений.

Для более детального анализа структуры распределения используются такие показатели, как квартили, делящие ранжированный ряд на четыре равные части, децили – на 10 равных частей. Возможность и необходимость расчета тех или иных показателей определяется размером изучаемой совокупности и целью исследования. Чем больше объем совокупности, тем более детально, с разбивкой на большее число частей можно изучать структуру распределения.

В практических исследованиях наиболее часто используются квартили. Первый (нижний) квартиль - это значение признака у единицы изучаемой совокупности, делящей ранжированный ряд на две части: 25% единиц имеют значение признака ниже квартильного и 75% - выше квартильного. Порядковый номер единицы определяется, как . Третий (верхний) квартили - это значение признака у единицы совокупности, делящей ранжированный ряд на две части: 75% единиц имеют значение признака ниже квартильного и 25% - выше квартильного. Порядковый номер единицы при этом определяется как .

По интервальному вариационному ряду квартили рассчитываются по формулам, аналогичным формуле расчета медианы. Для расчета первого квартиля находят квартильный интервал (первый интервал, в который попадает 25% единиц совокупности), и значение первого квартиля рассчитывается по следующей формуле:

, (2.3)

где - значение нижней границы квартильного интервала; - частоты квартильного интервала и предшествующего ему.

Значение третьего квартиля находится в интервале, в который попадает 75% единиц совокупности, и его величина рассчитывается:

. (2.4)

где - значение нижней границы квартильного интервала; - частоты квартильного интервала и предшествующего ему.

Межквартильный размах: . Этот показатель характеризует, на какую величину максимальное значение изучаемого признака превышает минимальное у 50% единиц совокупности, находящихся в центре распределения. Практическая значимость межквартильного размаха обусловлена тем, что значениям признака, заключенным между верхним и нижним квартилями, соответствуют максимальные частоты, а значениям, находящимся за пределами этого интервала (на хвостах распределения) - минимальные, т.е. они встречаются гораздо реже.

Значения показателей структуры для анализируемого распределения представлены в таблице 2.10.

Таблица 2.10 - Показатели структуры распределения регионов России по величине СДДН в 2013 г.

Рассмотрим содержательную интерпретацию этих характеристик. Как было сказано выше, средняя величина СДДН в регионах России в 2013 году составляла 21934 руб./чел., однако значение медианы указывает на то, что в 50 процентах всех регионов уровень показателя был ниже 20430 руб./чел. В 25 процентах регионов величина СДДН не превышала 18123 руб./чел., но при этом в ряде регионов, доля которых составляет так же 25 процентов, СДДН были выше 24343 руб./чел. В 50 процентах регионов России, находящихся в центре распределения, максимальный уровень денежных доходов населения превышал минимальный на 6220 руб./чел. Этот показатель характеризует размах вариации доходов, но не во всей совокупности регионов, а в центральной части распределения. Чтобы повысить информативность данныхпоказателей, их можно сравнивать с аналогичными характеристиками распределений за предыдущие годы или с данными по другим странам, предварительно приведя показатели к сопоставимому виду.

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2018-01-08 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: