При анализе электоральной статистики особое внимание следует уделить методам статистического и математического анализа. Существует великое множество таких методов, однако среди них необходимо выделить самые надёжные и самые адекватные для решения поставленных задач. Что касается статистических методов, то для нахождения связей между признаками чаще всего использовались коэффициенты корреляции и вариации.
С помощью коэффициента корреляции обнаруживается взаимосвязь признаков, когда на фактор, на который оказывается воздействие, помимо исследуемого влияющего фактора, оказывают воздействие ещё множество признаков. Данный метод используется для статистического анализа, коэффициент корреляции высчитывается для всей совокупности данных. В том случае, если значение коэффициента равно нулю, связь между факторами (признаками) отсутствует. Значение от 0,1 до 0,3 означает «слабую связь»; от 0,3 до 0,5 – «умеренную связь»; от 0,5 до 0,7 – «заметную связь»; от 0,7 до 0,9 – «тесную (высокую) связь»; от 0,9 до 0,99 – «весьма высокую связь»; и наконец единица означает функциональную зависимость, то есть на фактор который оказывается влияние, влияет только анализируемый фактор, и больше никакие (функциональная зависимость в социальных науках практически не встречается). В случае высоких уровней связи отметки на точечном графике выстраиваются в ряд и равноудалены как от оси X, так и от оси Y.
Коэффициент вариации отражает степень разброса показателей в генеральной совокупности, другими словами демонстрирует насколько ряд чисел однороден, близок к среднеарифметическому. Данный коэффициент применялся в основном для исследования стабильности электоральных показателей от выборов к выборам, то есть вычислялся для ряда отношений электорального показателя (например, явки) за два голосования. Так как применение данного коэффициента в вышеописанном случае может вызывать некоторые нарекания со стороны математиков, сомнения в его абсолютной здесь адекватности, то все важнейшие выводы сделанные с его помощью желательно перепроверять с помощью других математических и статистических методов, а значения данного коэффициента уточнять. Хотя коэффициент вариации степени однородности ряда данных является вполне самодостаточным, и его адекватность не может быть подвергнута сомнению. Формула коэффициента вариации:
|
V = Q / x * 100%
где V – коэффициент вариации, Q – корень из дисперсии (дисперсия определяет меру рассеивания, отклонения от среднего), x – среднеарифметическое анализируемого ряда данных.
Существуют две основные версии трактовки показателей данного коэффициента. Согласно первой, значение от 0 до 10% свидетельствует о том, что ряд низко вариативен (то есть разброс величин его составляющих не высок); значение от 10 до 50% означает средний уровень вариации; и значение от 50 до 100% означает, что ряд высоковариативен. Согласно второй версии трактовки значение до 33% означает, что ряд маловариативен, а все значения более данного показателя говорят о том, что степень вариации высока. В случаях проверки уровня стабильности электоральных показателей по отношениям чисел за разные годы для большей надёжности используется комбинированный вариант: значение до 10% свидетельствует о малой вариации, показатель до 33% - о среднем уровне вариации, а все значения больше – означают высокую или близкую к ней вариативность ряда.
|
Широко используется также кластерный анализ. Английское слово «кластер» означает «гроздь». Данный метод используется для классификации объектов по их существенным признакам. В зависимости от показателей объекты набирают определённую сумму баллов и располагаются на шкале. Сходные объекты объединяются в кластеры (группы), что и создаёт возможность для их классификации. Основное правило - при разбивке на кластеры – межкластерное расстояние не должно быть меньше расстояния между объектами внутри одного кластера. Понятие кластерного анализа достаточно широко, при «классическом» анализе подобного типа учитываются важнейшие факторы, влияющие на объекты, и эти факторы представляются в виде числовых значений (здесь могут быть, например, среднее количество гектаров пахотной земли на жителя анализируемого региона, размер средней зарплаты, стоимость коммунальных услуг и т.д.). При работе с электоральной статистикой ситуация проще – значения влиятельных факторов (например, уровень явки, голоса набранные определёнными политическими силами и т.д.) сразу представлены в виде чисел. Методика кластерного анализа применима для работы со всеми типами объектов электоральной статистики – от уровня областей, до уровня участков.