Графический анализ. Диаграмма «Короб с усами».




Проверка согласованности данных с нормальным распределением

 

Программ РAST (путь)

1) Ввод данных:

Выделите необходимые столбцы, скопируйте, перейдите в рабочее меню программы PAST, на вкладке Edit выберите команду Paste. Также можно использовать стандартные команды обмена данными (Ctrl + C; Ctrl + V). Для того, чтобы присвоить столбцам имена, отметьте флажок Edit labels. Поля в первой строке станут доступными для изменения. Введите имена столбцов. Снимите флажок.

Ваша форма должна выглядеть так, как показано на рис.1.

 

 

Рисунок 1 Ввод данных в программу PAST.

 

2) Гистограмма.

На главном меню найдите вкладку Plot(график). Эта вкладка содержит все возможные графики, которые строятся в программе PAST. Выделите нужный столбец, выберите Histogram. Откроется форма, представленная на рисунке 2. Отметьте флажок Fit normal, для того чтобы отобразилась кривая распределения.

 

Рисунок 2 Гистограмма для первой выборки

 

X Start и X End – соответственно наименьшее и наибольшее значение в исследуемой выборке.

Bins – количество столбцов. Здесь столбцы обозначают количество наблюдений в определенном интервале.

 

Проанализируйте получившийся график. Насколько кривая приближается к нормальному распределению?

 

Закройте окно с диаграммой.

 

3) Сравнение значений с нормальным распределением.

Откройте вкладку Plot. Команда Normal probability plot.

Проанализируйте график: красная линия изображает нормальное (гауссово) распределение. Чем ближе точки к данной линии, тем больше распределение выборки приближается к нормальному. См Рисунок 3.

 

Рисунок 3 График сравнения значений с нормальным распределением.

 

Анализ по критериям. Для проверки согласованности закона распределения используются следующие критерии:

Шапиро – Уилкоксона – наиболее мощный критерий;

Жарка – Бера – критерий проверки симметрии распределения:

Монте – Карло

Хи – квадрат – для выборок большого объема.

Выделите столбец с данными. Выберите: Past – Statistics - Normality test.

 

 

Таблица 1. Критерии согласованности с нормальным распределением.

 

N, объем выборки.  
Shapiro-Wilk W 0,933
p(normal) 0,1971
Jarque-Bera JB 0,8963
p(normal) 0,6388
p(Monte Carlo) 0,4794
Chi^2 0,57895
p(normal) 0,44673
Chi^2 OK (N>20) NO

 

 

Проанализируйте получившиеся p – значения. Если величина p <0,05, то распределение выборки отлично от нормального. Наиболее показательно p- значение для критерия Шапиро – Уилкоксона, но и p- значения для других критериев стоит учитывать. Для нашего примера критерии представлены в таблице 1. Мы видим, что p – значения достаточно велики, что бы утверждать о нормальном распределении выборки.

 

Далее определим, насколько отличаются наши выборки, иными словами, можно ли утверждать о принадлежности данных по матерям и детям к разным генеральным совокупностям. Для этого проведем графический анализ с помощью диаграммы «boxplot».

Графический анализ. Диаграмма «Короб с усами».

Программа InStat

  1. По умолчанию количество строк в каждом столбце 100. Однако количество данных скорее всего гораздо больше 100. Чтобы увеличить количество строк необходимо: Manage — Resize Worksheet. В появившемся окне (Рисунок 4) изменить 100 в графе Length на необходимое значение (максимальное количество в большей выборке)
  2. Вставьте свои данные в соответствующие столбцы.

Рисунок 4 Окно для изменения длины столбца (количества строк)

  1. На вкладке Graphics, выберете Boxplot
  2. Отметьте флажки, как показано на рисунке 4:

· Данные (Plot data points)

· Размах значений (with jitter)

· Усы (show outliers)

· Доверительный интервал для медиан (Show confidence limits for medians)

· Соединить медианы (Connect medians)

· Средние значения(Show means)

· Доверительный интервал для средних (Show 1 devs from mean)

 

Рисунок 5 Окно для построения «Короба с усами»

 

На полученном графике (рисунок 6), точкам соответствуют данные выборок. Голубые прямоугольником («коробом») обозначен интервал от первой до третьей квартили.

Медиана изображена синей пунктирной линией.

Короткая жирная линия указывает на среднее значение по выборке, а зеленые короткие черточки – доверительные интервалы для средних.

Так как объем выборок большой, то данные могут полностью закрыть «короб с усами». Для редактирования размера точек: Chart – Series. В появившемся окне Editing (Рисунок 6) надо выбрать X1, проконтролируйте обозначение — серая точка.

Рисунок 6 Окно для редактирования графика «короб с усами»

 

Далее на вкладке Points изменимграфы Width и Height:

Рисунок 7 Редактирование точек на «коробе с усами»

Аналогично изменить размер точек для второй выборке X2.

На рисунке 8 изображена диаграмма «boxplot» для наших данных.

Рисунок 8 Диаграмма «boxplot»

 

Чем дальше друг от друга расположены медианы и средние, тем сильнее различия между исследуемыми выборками значений. Основной критерий для предположения о различии выборок: среднее значение одной выборки не входит в доверительный интервал для среднего значения другой.

 

Мы можем наблюдать, что доверительные интервалы для средних не включают в себя средние значения сравниваемых выборок. Следовательно, можно предположить, что различия между выборками статистически значимы. Для доказательства проведем дальнейший анализ.

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-04-27 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: