Меры центральной тенденции.




Качественные шкалы.

1) Порядковые шкалы. Расстояния между местами/значениями разное (напр. рейтинг песен на радио по голоса). В соц.опросах используются слова вроде «часто/редко/иногда», «нравится/не очень нравится» и т.д.; сюда же возрастные промежутками (напр. «выберите, сколько вам лет: 0-5, 5-10 и т.д.), поэтому вообще нельзя сравнивать во сколько раз или на сколько баллов что-то от чего-то отличается.Есть порядок, можно измерить частоту.

2) Номинальные шкалы. Неупорядоченные, значения разные, произвольные. Напр. «Ваше любимое животное?» и т.д.в опросниках – может быть с заданными ответами или свободного типа. Единственное, что можно на них считать – это частоты (т.е. сколько раз респонденты выбрали/указали собаку/кошку/другое животное). Плюс к этой шкале относится дихотомия (где переменная принимает только 2 значения – Да/Нет).

Всё то, что можно делать со шкалами более низкого порядка, то есть теми у которых меньше свойств, можно делать и со шкалами более высокого порядка.

Гипотеза – предположение,которое нуждающееся в проверке и может быть проверено (иначе это не гипотеза).

Статистическая гипотеза:

1) Касается классов объектов (не один человек, а хотя бы группа).

2) Парная. Состоит из двух гипотез: нулевая «Н0» – гипотеза об отсутствии чего то, альтернативная гипотеза «Налт» – гипотеза о наличии чего то, о наличии связи, («чем – тем» или кто то лучше кого то, или кто то что то предпочитает). Когда мы ее проверяем, то подтверждается одна из гипотез (с точностью до N%, потому что выводы должны иметь отношение ко всей генеральной совокупности). НО с этой процентной относительностью мы вообще не можем принять или отвергнуть «Налт» и не можем принять «Н0» – её можно либо отвергать, либо не отвергать, – доказать статистически, что чего-то не существует, нельзя, т.к. что-то может существовать, но наш метод недостаточно хорош для проверки либо недостаточно данных.

Гипотеза – это суждение, оно не формулируется как вопрос,задание или предположение (с вводной частью «Пусть что-то…»).

Одномерное частотное распределение. Групировки

Описательная статистика. Не позволяет делать выводы, которые объясняют гипотезы (не проверяет гипотезы).Только компактно представляет данные.

Инференциальная статистика. Не проверяет гипотезы. Позволяет дать ответ на вопрос, можно ли распространить (экстраполировать) выборочные данные на генеральную совокупность – показывает процент ошибки (погрешность).

Аналитическая статистика. Включает в себя сильно различные методы проверки гипотез. Методы зависят от: характера гипотезы, размера выборки и т.д. Можно сочетать разные методы. Проверяет с точностью до выборки.

Описательная статистика

Распределения – это все значения переменной с указанием количества кейсов соответствующих каждому значению.

Чтобы найти частоту искомого значения, будем использовать частотный анализ (одномерное частотное распределение).

3 вида процентов частоты:

-от всей выборки,

- от числа ответивших,

- от числа отсутствующих ответов.

Накопленнаячастота – это сумма всех предыдущих частот по этому значению(имеет смысл для порядковых шкал).

Группирока - объединение значения переменных в группы по какому-то обоснованию.

Когда используются:

1) удобно при обилии/избытке вариантов;

2) если много единичных ответов, которые ничего не говорят о группе;

3) когда нужно преодолеть ограничения того или иного метода (не везде можно обработать слишком много значений).

ВИДЫГРУПИРОВОК:

1. Тематические – по теоретическому обоснованию. Их можно делать для всех видов шкал. Напр. рост, виды животных, классы объектов. Чаще всего используют для номинальных шкал (т.к. в них беспорядок).

2. Аналитические – используются только на количественных шкалах. Шкала разбивается на равные отрезки и выбирается равный по всей шкале шаг.

 

Многомерное распределение

Многомерное распределение представляется в виде таблицы сопряженности (кросстабуляция).
Таблицы сопряженности считаются на двух переменных. Не должно быть исследования, где представлены одни одномерные распределения.

Графики

Столбиковая диаграмма. Строится на качественных шкалах (номинальные и порядковые). Свойства:
- ширина столбцов не несет смысла, она фиксирована;
- промежутки между столбиками –||–;
- высота столбцов соответствует частоте.

Круговая диаграмма. Строится только на номинальных шкалах. Предпочтительно иметь от 2 до 7 значений, когда респондент может выбрать 1 и только 1 вариант значений. Вырезать можно 1 и только 1 сегмент. Нельзя делать 3Д-диаграмму под углом, т.к. ухудшается наглядность и восприятие.

Ленточные диаграммы. Стоятся в основном на порядковых шкалах. Высота столбиков не несет смысловой нагрузки и фиксирована. Показывает накопленную частоту и каждый сектор ее – это сумма процентов для этого значения и стоящего перед ним.

Гистограммы. Строятся на количественных шкалах. Ширина и длина столбцов имеют смысл, между столбцов нет промежутков. По ОУ расположены частоты, а по ОХ – значения диапазона.

Основные описательные статистики

Меры центральной тенденции.

Мода – то значение переменной, которое обладает наибольшей частотой в данной выборке. Применяется на всех шкалах, даже на номинальной (единственная такая МЦТ). Минус применения: не разграничивает, насколько сильно отличаются значения. Модовая тенденция (модовое распределение) – отсутствие средних значений при наличии минимума и максимума (из крайности в крайность).

Медиана – МЦТ. Все значения сортируются по возрастанию и выбирается срединное.Медиана при нечётном количества значений будет являться среднее арифметическое двух соседних «срединных» значений. Чаще всего считает на количественных, иногда на порядковых. Минус: не показывает края и не учитывает всех значений.

Среднее арифметическое – МЦТ, учитывает все значения. Минус: отдельные нерепрезентативные значения могут сильно искажать ср.арифм.

Выброс – единичное значение, которое сильно отклоняется от среднего. Поэтому чаще всего его исключают, но для этого нужно обоснование.

МЦТ для количественных шкал:

· Минимальное и максимальное значение.

· Размах – разность максимального и минимального значения.

Нормальное распределение

Равномерное распределение – распределение с равными частотами значений.

Нормальное распределение. Особенность НР в том, что чем ближе значение к среднему, тем чаще оно встречается и вероятность появления значения экспоненциально (очень быстро) убывает по мере удаления от среднего. График нормального распределения = кривая Гаусса. Экспоненциальная зависимость:

Никогда не пересекает ОХ, хотя вечно стремится – потому что значения никогда не могут быть равны 0. При значительном смещении линии, он перестает быть графиком норм.распр.

Меры разброса данных

Разброс данных показывает, насколько значение откланяется от среднего.

Дисперсия – один из методов. Показывает меру разброса данных, усреднённая мера. Для большого количества при поиске дисперсии мы делим не на V выборки, а на (V выборки -1). Формула:

Стандартное отклонение – мера разброса случайной величины вокруг ее среднего значения (s.d.= Соизмеримо со средним арифметическим.

Для того что бы сравнивать степень разброса данных между распределениями среди разных параметров используется коэффициент вариации. К.В. = (частное стандартного отклонения и среднего арифметического).

Стандартная ошибка –(s.e.) погрешность измерения после удаления всех погрешностей. Зависит от двух параметров: чем меньше выборка, тем больше ошибка, чем больше разброс, тем больше ошибка. Стандартная ошибка – стандартное отклонение, деленное на корень из объема выборки: .

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-04-26 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: