Глава 11. Человек и другие люди........ 71 25 глава




Чтобы показать применение этих критериев на примерах, потребова­лось бы слишком много места. При желании читатель может подробнее ознакомиться с ними по специальным пособиям.

1 Такие дачные чаще всего получаются при ранжировании количественных данных, которые нельзя обработать с помощью параметрических тестов.

it и обработка данных

-

Корреляционный анализ

При изучении корреляций стараются установить, существует ли ка­кая-то связь между двумя показателями в одной выборке (например* между ростом и весом детей или между уровнем IQ и школьной успеваемостью) либо между двумя различными выборками (например, при сравнении пар близнецов), и если эта связь существует, то сопровож­дается ли увеличение одного показателя возрастанием (положительная корреляция) или уменьшением (отрицательная корреляция) другого.

Иными словами, корреляционный анализ помогает устанойить, мож­но ли предсказывать возможные значения одного показателя, зная величину другого.

До сих пор при анализе результатов нашего опыта по изучению действия марихуаны мы сознательно игнорировали такой показатель, как время реакции. Между тем было бы интересно проверить, сущест­вует ли связь между эффективностью реакций и их быстротой. Это позволило бы, например, утверждать, что чем человек медлительнее» тем точнее и эффективнее будут его действия и наоборот.

С этой целью можно использовать два разных способа: параметриче­ский метод расчета коэффициента Браве - Пирсона (г) и вычисление коэффициента корреляции рангов Спирмена (rj, который применяется к порядковым данным, т.е. является непараметрическим» Однако разберемся сначала в том, что такое коэффициент корреляции.

*

Коэффициент корреляции

Коэффициент корреляции - это величина, которая может варьировать в пределах от +1 до — L В случае полной положительной корреляции этот коэффициент равен плюс 1, а при полной отрицательной-минус L На графике этому соответствует прямая линия, проходящая через точки пересечения значений каждой пары данных:

Переменная I

А '

Переменная В

Полная положительная корреляция [г = +1)

20'

Приложение

В случае же если эти точки не выстраиваются по прямой линии, а образуют «облако», коэффициент корреляции по абсолютной величине становится меньше единицы и по мере округления этого облака прибли­жается к нулю:

В случае если коэффициент корреляции равен 0, обе переменные полностью независимы друг от друга,

В гуманитарных науках корреляция считается сильной, если ее коэффициент выше 0,60; если же он превышает 0,90, то корреляция считается очень сильной. Однако для того, чтобы можно было делать выводы о связях между переменными, большое значение имеет объем выборки: чем выборка больше, тем достовернее величина полученного коэффициента корреляции. Существуют таблицы с критическими значе­ниями коэффициента корреляции Браве-Пирсона и Спирмена для разного числа степеней свободы (оно равно числу пар за вычетом 2, т. е. п — 2). Лишь в том случае> если коэффициенты корреляции больше этих критических значений, они могут считаться достоверными. Так, для того чтобы коэффициент корреляции 0,70 был достоверным, в анализ должно быть взято не меньше 8 пар данных при вычислении

г (табл. В.4) и 7 пар данных при вычислении (табл

5 в дополнении Б,5).

С тиши-тика и /юраоотка thin пых 30Q

Коэффициент Браве-Пирсона

Для вычисления этого коэффициента применяют следующую форму­лу (у разных авторов она может выглядеть по-разному):

где -сумма произведений данных из каждой пары;

п - число пар;

-средняя для данных переменной X;

-средняя для данных переменной У;

-стандартное отклонение Для распределения х;

-стандартное отклонение для распределения у. Теперь мы можем использовать этот коэффициент для того, чтобы установить, существует ли связь между временем реакции испытуемых и эффективностью их действий. Возьмем, например, фоновый уровень контрольной группы.

Д1      
Д2      
ДЗ 1 г К>8   г  

Отрицательное значение коэффициента корреляции может означать, что чем больше время реакция, тем ниже эффективность. Однако величина его слишком мала для того, чтобы можно было говорить о достоверной связи между этим двумя переменными.

Теперь попробуйте самостоятельно подсчитать коэффициент корре­ляции для экспериментальной группы после воздействия, зная, что

j j -

.40 Приложение Ь

Какой вывод можно сделать из этил результатов? Если вы считаете, что между переменными есть связь, то какова она-прямая или обрат­ная? Достоверна ли она [см. табл. 4 (в дополнении Б. 5) с критическими значениями г]?

Коэффициент корреляции рангов Спнрмена rs

Этот коэффициент рассчитывать проще, однако результаты полу­чаются менее точными, чем при использовании г, Это связано с тем, что при вычислении коэффициента Спирмена используют порядок следо­вания данных, а не их количественные характеристики и интервалы между классами.

Дело в том, что при использовании коэффициента корреляции рангов Спирмена (г,) проверяют только, будет ли ранжирование данных для какой-либо выборки таким же, как и в ряду других данных для этой выборки, попарно связанных с первыми (например, будут ли одинаково «ранжироваться» студенты при прохождении ими как психологии, так и математики, или даже при двух разных преподавателях психологии?). Если коэффициент близок к + 1, то это означает, что оба ряда практи­чески совпадают, а если этот коэффициент близок к — 1, можно говорить о полной обратной зависимости.

Коэффициент rs вычисляют по формуле

где d- разность между рангами сопряженных значений признаков (неза­висимо от ее знака), а п- число пар.

Обычно этот непараметрический тест используется в тех случаях, когда нужно сделать какие-то выводы не столько об интервалах между данными, сколько об их рангах, а также тогда, когда кривые распреде­ления слишком асимметричны и не позволяют использовать такие параметрические критерии, как коэффициент г (в этих случаях бывает необходимо превратить количественные данные в порядковые).

Поскольку именно так обстоит дело с распределением значений эффективности и времени реакции в экспериментальной группе после воздействия, можно повторить расчеты,'которые вы уже проделали для этой группы, только теперь не для коэффициента г, а для показателя rF Это позволит посмотреть, насколько различаются эти два показателя.

Cniwrntcnmtcti if оораштгка ошшых

             
Испыту- Эффек- Время Ранга Ранги d d*
емые тивность реакции X* У*    
  .V у        
Д8         . 7  
Д9     L   ]  
Д ю       11,5 3,5 12,25
Д и       7,5 4,5 20,25
Д 12       13,5 11,5 132,25
Д 13     8,5   6,5 42,25
Д 14     8,5 9,5    
Ю9         1,5 2,25
Ю 10 .7          
Д 11       9,5 2,5 6,25
Ю 12           I
Ю 13            
Ю 14       7,5 4,5 20,25
Ю 15       13,5 6,5 42,25
Ю 16            
            428.

* Следует помнить, что

1) для числа попаданий 1-й ранг соответствует самой высокой, л 15-й-самой низкой результативности, тогда как для времени реакции 1-й ранг соответствует самому короткому времени, а 15-й-самому долгому;

2) данным ex aequo придается средний ранг.

Таким образом, как и в случае коэффициента г, получен положитель­ный, хотя и недостоверный, результат. Какой же из двух результатов правдоподобнее: г = —0,48 или rs = +0,24? Такой вопрос может встать лишь в том случае, если результаты достоверны.

Хотелось бы еще раз подчеркнуть, что сущность этих двух коэф­фициентов несколько различна. Отрицательный коэффициент г указы­вает на то, что эффективность чаще всего тем выше, чем время реакции меньше, тогда как при вычислении коэффициента г5 требовалось про­верить, всегда ли более быстрые испытуемые реагируют более точно, а более медленные - менее точно.

Поскольку в экспериментальной группе после воздействия был полу­чен коэффициент rst равный 0,24, подобная тенденция здесь, очевидно, не прослеживается. Попробуйте самостоятельно разобраться в данных для контрольной группы после воздействия, зная, что 2jd2 = 122,5:

гs = 1 —---------------= 1 —--------------- — 1 —; достоверно ли?

F

Каков ваш вывод?..........................................

Итак, мы рассмотрели различные параметрические и непараметри­ческие статистические методы, используемые в психологии. Наш обзор

был весьма поверхностным, и главная задача его заключалась в том, чтобы читатель тюнял, что статистика не так страшна, как кажется, и требует в основном здравого смысла. Напоминаем, что данные «опыта», с которыми мы здесь имели дело,-вымышленные и не могут служить основанием для каких-либо выводов. Впрочем, подобный экс­перимент стоило бы действительно провести. Поскольку для этого опыта была выбрана сугубо классическая методика, такой же статисти­ческий анализ можно было бы использовать во множестве различных экспериментов. В любом случае нам кажется* что мы наметили какие-то главные направления, которые могут оказаться полезны тем, кто не знает, с чего начать статистический анализ полученных результатов.

Резюме

Существуют три главных раздела статистики: описательная ста­тистика, индуктивная статистика и корреляционный анализ,

I. Описательная статистика

 

1. Задачи описательной статистики - классификация данных, постро­ение распределения их частот, выявление центральных тенденций этого распределения и оценка разброса данных относительно средних.

2. Для классификации данных сначала располагают их в возрастаю­щем порядке. Далее их разбивают на классы по величине, интервалы между которыми определяются в зависимости от того, что именно иследователь хочет выявить в данном распределении,

3. К наиболее часто используемым параметрам, с помощью которых можно описать распределение, относятся, с одной стороны, такие величины, как мода, медиана и средняя арифметическая, а с другой-показатели, разброса, такие как варианса (дисперсия) и стандартное отклонение,

4. Мода соответствует значению, которое встречается чаще других или находится в середине класса,' обладающего наибольшей частотой.

Медиана соответствует значению центрального данного, которое может быть получено после того, как все данные будут расположены в возрастающем порядке.

Средняя арифметическая равна частному от деления суммы всех данных на их число.

Распределение считается нормальным, если кривая распределения имеет ко л околообразный вид, а все показатели центральной тенденции совпадают, что свидетельствует о симметричности распределения,

5. Диапазон распределения (размах вариаций) равен разности между наибольшим и наименьшим значениями результатов,

6. Среднее отклонение -это более точный показатель разброса, чем диапазон распределения. Для расчета среднего отклонения вычисляют среднюю разность между всеми значениями данных и средней арифме-

Статистики и оорапатка дачны

тической, или, упрощенно»

 

Среднее отклонение =

7, Еще один показатель разброса, вычисляемый из среднего откло­нения,-это варианса (дисперсия), равная среднему квадрату разностей между значениями всех данных и средней:

Варианса -

8. Наиболее употребительным показателем разброса служит стан-дартное отклонение, равное квадратному корню из вариансы» Таким образом, это квадратный корень из суммы квадратов всех отклонений от средней:

Стандартное отклонение =

V и V п —

9+ Важное свойство стандартного отклонения заключаете в том, что независимо от его абсолютной величины в нормальном распределении оно всегда соответствует одинаковому проценту данных, располага­ющихся по обе стороны от средней: 68% результатов располагаются в пределах одного стандартного отклонения в обе стороны от средней, 95% - в пределах двух стандартных отклонений и 99,7%-в пределах трех стандартных отклонений.

10. С помощью перечисленных выше показателей можно осущест­вить оценку различий между двумя или несколькими распределениями, позволяющую проверить, насколько эти различия могут быть экстра­полированы на популяцию, из которой взяты выборки. Для этого применяют методы индуктивной статистики.

-

IL Индуктивная статистика

1. Задача индуктивной статистики заключается в том, чтобы оце­нить значимость тех различий, которые могут быть между двумя распределениями, с целью выяснить, можно ли распространить найден­ную закономерность на всю популяцию, из которой были взяты выборки.

2. Для того чтобы определить, достоверны ли различия между распределениями, следует выдвинуть гипотезу, которую нужно будет затем проверить статистическими методами. Нулевой гипотезой на­зывают предположение, согласно которому различие между распре­делениями недостоверно, тогда как альтернативная гипотеза утверж­дает противоположное.

3. В том случае, если данных достаточно, если эти данные количест­венные и подчиняются нормальному распределению, для проверки гипотез используют параметрические критерии. Если же данных мало либо они

314 При.ш.жетн' К

являются порядковыми или качественными (см.дополнение Б.1), исполь­зуют непараметрические критерии.

4. Из параметрических критериев наиболее эффективен и чаще всего используется критерий"! Стьюдента. Этот критерий позволяет сравнить средние и стандартные отклонения для двух распределений. В случае если эти показатели принадлежат независимым выборкам, используют формулу

Для сопряженных выборок используют иную формулу:

5, Если необходимо сравнить три или большее число распределений, используют иной параметрический метод - дисперсионный анализ. При этом с помощью метода Шеффе можно выявить пары выборок, разли­чия между которыми достоверны либо недостоверны.

6. Критерий х2 (хи-квадрат) - это непараметрический критерий, по­зволяющий проверить, являются ли две переменные независимыми друг от друга,.По этому методу сравнивают, как распределяются эмпири­ческие частоты в зависимости от критериев для каждой переменной, с тем, как они распределились бы теоретически, если бы переменные были независимыми. Далее с помощью таблицы, в которую сводятся все частоты, вычисляют критерий х2. Для этого сначала находят разницу между каждой эмпирической (Э) и соответствующей теоретической (Т) частотой, а затем сумму этих разностей:

7. Критерий знаков (биномиальный тест)-еще один непараметри­ческий метод, позволяющий легко определить, оказала ли независимая переменная существенное влияние по сравнению с исходным уровнем (фоном). Для этого сначала подсчитывают число «ухудшений» (-) или число «улучшений» (+), а затем сравнивают одно из этих двух чисел с тем, что могло бы получиться в результате чистой случайности (1 шанс из 2, или л/2). Для этого применяют формулу

(Х±0.5)~

и обработки <Штых 315

8, Существуют и другие непараметрические тесты, которые прихо­дится использовать для проверки гипотез тогда, когда нельзя применить параметрические критерии, К этим методам, в частности, относится критерий рангов позволяющий определить, случайна или нет очеред­ность событий в той или иной последовательности, а также критерий V и критерии 7\ Последние лва критерия используют в случае поряд­ковых переменных соответственно для независимых и зависимых выборок.

9. Какой бы критерий ни использовался, его вычисленное значение следует сравнить с табличным для уровня значимости 0,05 с учетом числа степеней свободы. Если при этом вычисленный „результат ока­жется выше, нулевая гипотеза может быть отвергнута и можно, следо­вательно, утверждать* что разница достоверна,

III. Корреляционный анализ

1. Задача корреляционного анализа заключается в том, чтобы устано­вить возможную связь между двумя показателями, полученными на одной и той же или на двух различных выборках. При этом устанавли­вается, приводит ли увеличение какого-либо показателя к увеличению или уменьшению другого показателя.

2. Коэффициент корреляции колеблется в пределах от -И, что соответствует полной положительной корреляции, до — 1 в случае полной отрицательной корреляции. Если этот коэффициент равен 0, то никакой корреляции между двумя рядами данных нет.

3. Коэффициент корреляции Браве - Пирсона (г)-э?о параметрический показатель, для вычисления которого сравнивают средние и стандарт­ные отклонения результатов двух измерений При этом используют формулу

г =

4, Коэффициент корреляции рангов Спирмена (г5)-это непараметри­ческий показатель, с помощью которого пытаются выявить связь между рангами соответственных величин в двух рядах измерений.

5. Коэффициент корреляции может быть значимым лишь при доста­точном числе пар данных, взятых в анализ. Это можно проверить с помощью таблицы пороговых значений г или rs для уровня значимости 0,05.

Результаты вычислений,

которые предложено было сделать читателям

Различие между данными контрольной и опытной группы после воздействия (критерий / для независимых выборок):

t = 3,11; л — 28; р < 0,05; достоверно.

."Ш> Пргиожапк' Б

Различие между данными до и после воздействия для опытной группы (критерий г для зависимых выборок):

достоверно.

Сравнение показателей эффективности и времени реакций для опыт­ной группы после воздействия (коэффициент г Браве- Пирсона):

недостоверно.

Сравнение показателей эффективности и времени реакции для конт­рольной группы после воздействия (коэффициент rs Спирмена):

достоверно.

Дополнение Б,5. Таблицы

Таблица 2. 3 терпя X2 Л начения кри- 0,05  
  3,84  
  5,99  
  7,81  
  9,49  
   
  12,6  
  14,1  
  15,5  
  16,9  
  18,3  
- Таблица 3* Достоверные  
значения Z    
Р Z  
0,05 1,64  
0,01 2,33  
Таблица 1. Значения кри-
терия 1 Стьюдента
   
I  
  2,92
  2,35
  2,13
  2,02
  1,94
  1*90
Ь 1,86
  1,83
  1,81
  1,80
  1J8
  1,77
  1J6
  1,75
  1,75
  1,74
  1,73
  1,73
  1,73
  1,72
  1,72
  1,71
  1,71
  1,71
  1*71
  1,70
  1,70
  1,70
  1,70
  1,68
оо 1,65

ii it обработки Оштых

Таблица 4. Достоверные
(критические) значения г
р = 0,05
(5%)
  0,88
  0,81
  0,75
  0,71
  0,67
  0,63
  0,60
  0,58
  0,55
  0,53
  0,51
  0,50
  0,48
  0,47
  0,46
  0,44
  0,43
  0,42
Таблица 5, Достоверные  
(критические): значения rs  
р - 0ъ05  
  1,000  
  0,900  
' 4 0,829  
  0,714  
  0,643  
  0,600  
  0,564  
  0,506  
  0,456  
  0,425  
  0,399  
  0,377  
  0,359  
  0,343  
  0,329  
  0,317  
  0,306  
       

Примечания. J) Для больших выборок или уровня значимости меньше 0,05 следует обратиться к таблицам в пособиях по статис­тику

2) Таблицы значений других непараметрических критериев можно найти в специальных руководствах (см. библиографию).

Литература

Chatillon G.t 1977. Statistique en Sciences humaines, Trois-Rivieres, Ed, SMG, Gilbert N.T 1978. Statistiques, Montreal, Ed. HRW. Moroney MJ.t 1970. Comprendre la statistique, Verviers, Gerard et Cie, Siegel S*t 1956* Non-parametric Statistic, New York* MacGraw-Hill Book Co'.

Словарь терминов

Абсолютное значение-значение числа, в котором не учитывается его знак; обозначается двумя вертикальными черточками с обеих сторон от числа.

Абстинентный синдром-совокупность символов, возникающих в ре* зультате прекращения употребления наркотика.

Автономная мораль-мораль, правила которой устанавливаются самим человеком и могут быть им же изменены.

Агент-термин, означающий в экспериментах по экстрасенсорике лицо, которое должно передать, сообщить что-то перципиенту.

Агнозия-состояние, при котором мозг не может расшифровать информацию, поступающую от нормально функционирующих рецепто­ров.

Адреналин-гормон, вырабатываемый мозговым веществом надпо­чечников; активирующее действие его на организм сравнимо с действием симпатической нервной системы.

Аккомодация-механизм, состоящий в изменении существующей схемы для приспособления ее к новому объекту или ситуации.

Акроним-слово, составленное из первых букв других слов, обозна­чающих, например, ту или иную организацию, страну или общественный институт.

Акростих -стихот во рение* в котором первые буквы каждой строки* прочитанные по вертикали, составляют имя или ключевое слово.

Актуализировать-перевести из состояния потенциального в состоя­ние реальное.

Алгоритмический метод-процедура, используемая при решении задач и заключающаяся в систематическом рассмотрении всех возмож­ных решений.

Альбинизм - наследственная аномалия, характеризующаяся частич­ным или полным отсутствием пигментации кожи, волос и радужной оболочки глаза. Альбинизм, по всей видимости, обусловлен отсутствием фермента тирозиназы, участвующего в синтезе пигмента меланина.

Альтернативная гипотеза (Нг)-гипотеза, согласно которой различия между выборками являются значимыми, т.е. отражают соответствую­щее различие внутри или между популяциями, из которых взяты эти выборки. Обычно альтернативная гипотеза соответствует рабочей ги­потезе исследователя..



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-08-20 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: