Лекция 2.1 Таблица и график
ТАБЛИЧНЫЙ СПОСОБ ПРЕДСТАВЛЕНИЯ ДАННЫХ
ЧАСТОТНАЯ ТАБЛИЦА
Используется чаще всего для представления формальных характеристик выборки, группы (пол, профессия и т.п.). В таблице перечисляются все возможные значения переменной, которым ставится в соответствие частота и доля.
Пример частотной таблицы.
Переменная «предпочитаемая фигура» | ni частота | wi доля |
Квадрат | 0,07 | |
Прямоугольник | 0,22 | |
Круг | 0,44 | |
Треугольник | 0,1 | |
Зигзаг | 0,16 |
В первом столбце таблицы перечислены все варианты переменной, во втором – частота того или иного варианта, в третьем – доля (относительная частота) варианта.
Частота (обычно обозначается как n i) – количественная мера выборов варианта. В таблице видно, что значение "квадрат" выбрало 5 испытуемых, "прямоугольник" – 15, "круг" – 30 и т.д.
Доля (частость, относительная частота; и обычно обозначается как wi) варианта вычисляется как отношение частоты к общему количеству наблюдений (испытуемых).
Согласно данным из приведенного примера, общее количество наблюдений (сумма всех частот) N = 5 + 15 + 30 + 7 +11 = 68
Таким образом,
W 1 = 5 / 68 = 0,07 (доля выборов «квадрат»)
W 2 = 15 / 68 = 0,22 (доля выборов «прямоугольник»)
Иногда, вместо доли или дополнительно в таблицу включают процентную долю. Процентная доля – доля умноженная на 100%.
ТАБЛИЦА ВАРИАЦИОННОГО РЯДА
Ранжированный в порядке возрастания или убывания ряд значений с соответствующими частотами и долями называется вариационным рядом.
Используется для порядковых и метрических переменных (номинальные переменные не поддаются ранжированию).
Пример таблицы вариационного ряда. Распределение вариантов (в данном случае порядок предпочтения) выбора красного цвета в тесте М.Люшера.
|
Позиция красного | ni | wi | нак. ni | нак. wi | нак. wi % |
0,27 | 0,27 | ||||
0,32 | 0,59 | ||||
0,21 | 0,80 | ||||
0,11 | 0,92 | ||||
0,02 | 0,94 | ||||
0,04 | 0,98 | ||||
0,01 | 0,99 | ||||
0,01 | 1,00 |
В Таблице в первом столбце перечислены значения (позиция красного цвета в выборах испытуемых в тесте Люшера) в порядке возрастания. Второй и третий столбцы также как и в частотной таблице – это частота и доля варианта. Например, на 1 позициях предпочтение красного цвета наблюдалось у 24 испытуемых, на вторых – у 28 и т.д.. Третий столбец – это накопленная частота, которая получается путем последовательного суммирования предыдущего значения частоты с текущим. В четвертом столбике – накопленная доля, которую рассчитывают по аналогии с накоплением частоты (только накапливаются доли).
Правило вычисления накопленных частот:
ИНТЕРВАЛЬНАЯ ТАБЛИЦА ВАРИАЦИОННОГО РЯДА
Если вариативность признака велика (большое количество значений), то для удобства представления вариационного ряда рекомендуется разбивать значения на интервалы.
Если переменная является величиной непрерывной, тогда интервалы представляют как полуоткрытые (открыты справа и закрыты слева). В приведенной таблице, значение переменной равное 83 находится первом интервале, а значение = 84 - во втором.
Для дискретных величин используют отрезки (закрыты справа и слева).
|
РАЗБИЕНИЕ НА ИНТЕРВАЛЫ
Число интервалов не должно быть слишком большим или слишком малым. Рекомендуется выбирать оптимальное количество интервалов.
В литературе присутствует множество рекомендаций и правил разбиения. Наиболее часто встречаемым является правило разбиения на интервалы Стерджеса. Однако, многие исследователи критикуют этот критерий из-за недостаточной обоснованности и рекомендуют использовать правила Скотта, Фридмана и другие.
Рассмотрим правило Стерджеса (Кремер Н.Ш., 2004).
ФОРМУЛА СТЕРДЖЕСА
· Число интервалов m=1+3,322 lg(n)
· Величина интервалов k=(xmax-xmin) / m
· Начало первого интервала xнач=xmin - k/2
Количество интервалов m, рассчитанное по формуле Стерджеса для разного объема групп
Объем группы | 8-11 | 12-22 | 23-45 | 46-90 | 91-181 | 182-362 |
Кол-во интервалов |
Начало формы
ГРАФИЧЕСКИЙ СПОСОБ ПРЕДСТАВЛЕНИЯ ДАННЫХ
Конец формы