Метод определения меры различия между наблюдаемыми и предполагаемыми (теоретическими) численностями — хи-квадрат.




Ранее были рассмотрены различные отношения между выборка­ми: количественное преобладание какого-то признака, представлен­ного в одной из выборок, теснота связи между выборками. Но есть еще одно важное отношение между ними: количественная разница распределений, благодаря которой при сопоставлении выборок от­крывается возможность прийти к содержательным выводам. Это от­ношение обнаруживается при сопоставлении распределений численностей. Допустим, что сравниваются две выборки, выпускников двух школ. Часть выпускников каждой школы сдавали экзамены в вузы. Из первой школы сдавали экзамены 100 человек, из них 82 успешно, не сдали 18. Таково распределение численности в первой выборке. Из второй школы сдавали экзамены в вузы 87 человек, выдержали 44 человека, не сдали — 43. Таково распределение численностей во второй выборке. Достаточно ли этих данных, чтобы утверждать, что подготовленность к вузовским экзаменам выпуск­ников этих школ неодинакова? На первый взгляд, разница налицо:

лучше подготовлены выпускники первой школы. Однако при таком раскладе численностей возможно влияние случайности. Поэтому встает вопрос, можно ли, считаясь с представленными распределе­ниями, прийти к статистически обоснованному выводу о мере под­готовленности к экзаменам в вузы той и другой выборки.

Метод, с помощью которого подвергаются статистическому ана­лизу описанные распределения численностей, получил название хи-квадрат, его обозначают греческой буквой x 2 с показателем степе­ни. Он был разработан математиком Пирсоном. Метод x 2 весьма универсален, применим во многих исследованиях, пригоден для ста­тистического анализа распределения численностей разнообразных количественных материалов, относящихся ко всем статистическим шкалам, в том числе и к шкале наименований.

Техника вычисления хи-квадрата довольно проста. Рассмотрим пример со сдачей экзаменов в вузы выпускниками первой и второй школ. В условии сказано, что всего намерены были сдавать экзаме­ны 187 человек: 100 учащихся (53,5%) из первой школы и 87 (46,5%) из второй. Предположим, что выпускники обеих школ под­готовлены одинаково, тогда и доли сдавших и не сдавших будут та­кие же, как доли их представленности в общем числе сдающих. Всего сдало экзамены 126 выпускников (82 + 44). Согласно выска­занному предположению, 53,5% от этого числа должны бы были прийтись на 1-ю школу — это составит 66,9 от 126 — и 46,5% на 2-ю школу, что составит 58,9 от 126. Такое же рассуждение повторяем и относительно несдавших. Их всего 61 человек (18 + 43). На 1-ю школу, как нам известно, должно, по предположению, прийтись 53,5% от этого числа, т.е. 33,0 от 61, а на долю 2-й школы — 46,5%, т.е. 28,1 от 61. Нуль-гипотеза, имеющая в данном раскладе тот смысл, что между выпускниками нет различия, при таком соот­ношении сдавших и несдавших подтвердилась бы. Однако в услови­ях этого исследования показано другое распределение. Количество выпускников 1-й школы, сдавших экзамены, составляет 82, а не 66,9, как можно было бы предположить, исходя из нуль-гипотезы. Соот­ветственно количество выпускников 2-й школы, сдавших экзамены, составляет в действительности всего 44, а не 58,9. Точно также, сравнивая количество несдавших (по условию с предполагаемым распределением) найдем по 1-й школе 18, а не 33, а по 2-й школе — 43, а не 28,1.

Расхождения между действительными распределениями и рас­пределениями, которые могли бы иметь место, если исходить из нуль-гипотез, налицо. Они-то и учитываются при вычислении x 2. Все сказанное удобно представить в виде таблицы-графика распре­деления численностей (табл. 7). Количества, которые были бы по­лучены при принятии нуль-гипотезы, заключены в скобки. В правом углу буквенное обозначение клетки.

Таблица 7

Школа Число сдавших Число несдавших Всего Долевые отноше­ния, %
Первая 82 А (66,9) 18 В (33,0) (100) 53,5
Вторая 44 С (58,9) 43 Д (28,1) (87) 46,5
Всего        

 

Получены разности по клеткам (знак разности несущественен). Клетки:

А fA = 82—66,9= 15,1;

В fB = 18 — 33 = 15,0;

С fC = 44 — 58,9 = 14,9;

Д fD = 43—28,1= 14,9. Формула хи-квадрат:

где f 0— наблюдаемые численности; f e предполагаемые (теоре­тические) численности.

В рассмотренном материале x 2 = 15,12/66,9 + 152/33 + 14,92/58,9 + 14,92/28,1= 288/66,9 + 225/33 + 222/58,9 + 222/28,1= 3,4 + 6,8 + 3,8 + 7,9 = 21,9

Для получения числа степеней свободы нужно воспользоваться формулой (только для хи-квадрат): fd = (k - 1)(с - 1) = (2 - 1) х (2 - 1) = 1 степень свободы, где k — число столбцов, с — число строк в таблице с анализируемым материалом.

Обратимся к таблице уровней значимости для одной степени свободы для хи-квадрат: x 20,99 = 6,6. Следовательно, полученная величина вполне достаточна для отклонения h 0. Есть все основания для содержательного вывода о различной степени подготовленности выпускников обеих школ к экзаменам в вузы.

Все вычисления, приводимые в этой главе, ведутся с точно­стью до первого знака, т.е. вычисляются целые и десятые. Этим объясняется та, в общем-то, несущественная разница при вычис­лениях одной и той же величины разными способами. Никакого практического значения встречающиеся расхождения в величи­нах не имеют.

Полезно знать, что коэффициент хи-квадрат и коэффициент че­тырехпольной корреляции взаимосвязаны и, поскольку известна численность и распределение сопоставляемых выборок, указанные коэффициенты могут быть определены один через другой.

Как показывает само название этого метода, числовой материал, подлежащий статистическому анализу, может быть распределен в таблице-графике, имеющей четыре поля. Такое расположение мате­риала облегчает все последующие действия с ним. Чтобы рассмот­реть технику вычисления коэффициента четырехпольной корреля­ции — он обозначается символом j (фи), — можно воспользовать­ся тем примером, где речь шла о вычислении коэффициента x 2. Вы­пускники двух школ сравнивались между собой по подготовленно­сти к вузовским экзаменам.

Школы Сдали Не сдали Всего
Первая 82 a 18 b 100 a + b
Вторая 44 c 43 d 87 c + d
Итого: 126 а + с 61 b + d  

 

Заменив буквенные обозначения числами, получим:

Для получения коэффициента х 2 нужно воспользоваться форму­лой х 2 = j2 · n. В данном примере х 2 = 0,342 · 187 = 0,1156 · 187 = = 21,7. Этот же коэффициент х 2 вычислялся другим приемом. По­лучено значение 21,9. Расхождение вызвано разницей в технике вычислений.

Коэффициент четырехпольной корреляции j может принимать значения от 0 до 1, причем знак получаемого j не принимается во внимание.

Психологу, намеренному воспользоваться для статистического анализа своих материалов методом хи-квадрат, нужно знать о неко­торых обязательных требованиях этого метода; о них не упомина­лось в приведенных примерах. При вычислении коэффициента х 2 необходимо брать для анализа только абсолютные численности вы­борок, но не относительные, в частности, не проценты. Необходи­мость учитывать это свойство объясняется тем, что значение коэф­фициента х 2 зависит от абсолютных величин рассматриваемых рас­пределений. Так, сравнение выборок с численностями 60 и 40 даст совершенно не тот результат, что сравнение выборок с численно­стями 6 и 4, хотя процентное отношение распределений в обоих случаях одинаково (60 и 40%).

Далее, для вычисления коэффициента х 2 нужно, чтобы в каждой клетке таблицы-графика было не менее пяти наблюдений. Наконец, нужно со вниманием относиться к определению числа степеней свободы; неверное определение этого числа повлечет за собой не­верное определение уровня значимости коэффициента по таблице.

Этим заканчивается рассмотрение статистических методов, отно­сящихся ко второму типу задач.

В этих задачах независимо от того, будут ли они практического или теоретического содержания, психолог сопоставляет, сравнивает между собой несколько выборок. При этом не следует забывать, что цель исследования не всегда состоит в том, чтобы при сопоставле­нии отвергнуть нуль-гипотезу. Иногда конечная или промежуточная цель исследования состоит в том, чтобы, допустим, сравнивая вы­борки, подтвердить нуль-гипотезу. Самый простой пример: исследо­ватель желает составить большую выборку, для чего необходимо объединить в ней учащихся нескольких школ. Естественно, решаю­щее значение имеет доказательство того, что группы учащихся из разных школ относятся к одной совокупности, нужно, чтобы при­мененные критерии подтвердили это, а значит, статистика должна подтвердить при сравнении групп нуль-гипотезу. Подтвердить или отвергнуть нуль-гипотезу при сопоставлении выборок — в этом и состоит назначение статистических критериев; наиболее простые из них были изложены в предшествующем тексте. Конечно, информа­ция, которую выявят статистические методы, может быть противоречи­ва утверждениям, которые намерен защищать исследователь. В таком случае ему придется внести поправки в свои утверждения или отка­заться от них.

Переходим к задачам третьего типа — задачам, рассмат­ривающим динамические, временные ряды.

Предположим, что психологу дано задание собрать информацию о состоянии умственной работоспособности школьников 8-х классов, начиная со второй недели учебного года и до девятой недели вклю­чительно. Одной из методик, с помощью которых можно фиксиро­вать состояние умственной работоспособности, считается тест Кре­пелина. Он состоит из большого количества примеров, в каждом из них нужно складывать два двузначных числа; учитывается общее число правильно решенных примеров. Каждые 3 минуты испытуе­мые по сигналу экспериментатора отмечают черточкой сделанное. Общая длительность эксперимента в зависимости от возраста со­ставит 9, 12 или 15 минут. Этой методикой и воспользовался пси­холог. Он начал с того, что сформировал из учащихся, средние ус­пехи которых оценивались за предыдущее полугодие баллами 4 и 5, выборку из 10 человек. Все они изъявили желание участвовать в эксперименте. С этими учащимися психолог в течение первой недели учебного года провел по 12 тренировочных занятий; это было необходимо, иначе рост продуктивности вследствие упражняемости замаскировал бы изменения в динамике работоспо­собности. Затем начался эксперимент: по субботам после уроков учащиеся этой выборки в течение 12 минут работали с тестом Крепелина. Эксперимент, как было сказано, продолжался 8 не­дель. Были получены следующие данные, средние по всей выбор­ке (рис. 4).

Визуальная оценка полученного динамического ряда свидетельст­вует о снижении умственной работоспособности, в чем, конечно, нет ничего удивительного. Однако снижение идет не вполне равно­мерно. Это ясно видно из графика.

Недели экспери­мента I II III IV V VI VII VIII
Средняя продук­тивность по тесту Крепелина                

Основная тенденция измене­ния умственной работоспособ­ности вполне ясна. Наблюдае­мые, в общем, незначительные отклонения от этой тенденции могут быть на графике устра­нены методом сглаживания. В этом случае применим метод скользящей средней. Для сгла­живания суммируются три по­казателя у — в данном приме­ре это показатели продуктив­ности по тесту, — далее, опус­кая по одному показателю, суммируются одна за другой триады. Средняя каждой триа­ды принимается за показатель сглаженной ломанной, если ори­ентироваться по графику. Смысл проводимого действия состоит в том, что основная тенденция выступает более отчетливо.

              — средние по триадам
               

В только что рассмотренном примере сглаживание имеет такой вид:

Результаты сглаживания приобретают большую наглядность при нанесении их на график. Выступает основная тенденция динамики умственной работоспособности. Судя по показателям, полученным после сглаживания, в течение первых трех экспериментальных не­дель значительного снижения работоспособности не наблюдается, а далее идет непрерывное и резкое ее снижение. Сглаживание, как видно на графике, устранило колебания в работоспособности, отме­ченные на первичном графике после V недели. При сглаживании по триадам общее число точек уменьшается на 2.

Какое значение имеет выделение посредством сглаживания ос­новной тенденции? Если условия, благодаря которым возникла ос­новная тенденция, сохранятся, то и эта тенденция с высокой веро­ятностью сохранится и, таким образом, по основной тенденции мо­жет быть построен прогноз, как будут развиваться изучаемые явле­ния. Но такой прогноз возможен только при стабильности опреде­ленных условий. Для его построения нужен не только формальный, но и содержательный анализ; он же позволяет раскрыть значение факторов, вызвавших отклонения в ту или другую сторону от ос­новной тенденции.

е Техника метода скользящей средней дает возможность выбирать различные способы объединения показателей для сглаживания. Та­ковыми могут быть не только триады, но при достаточно большом числе показателей (порядка 30—40 и более) для выведения сколь­зящей средней могут быть выбраны пентады (объединения пяти по­казателей) и даже септиды (семь показателей).

Нужно иметь в виду, что наглядный и простой метод скользящей средней малопригоден для сглаживания динамики процессов, развитие которых во времени не имеет линейной формы (см.: рис. 3, схема 5, с. 265). Сглаживание методом скользящей средней в таких случаях мо­жет привести к искажению действительной тенденции развивающегося процесса. Исследователю следует внимательно всмотреться в материал, подлежащий сглаживанию, чтобы решить, имеет ли он право восполь­зоваться этим методом. Если криволинейная зависимость отражена в достаточно больших отрезках кривой, то каждый из этих отрезков в отдельности может быть подвергнут сглаживанию. Таково ограничение в использовании метода скользящей средней.

Анализируя выраженную на графике основную тенденцию в ее приближении к прямой, можно заметить, что метод не дает меры наклона, угла, который образуется между полученной после сгла­живания приближающейся к прямой ломаной и осью абсцисс. Ме­жду тем, узнав величину этого угла, исследователь получит инфор­мацию о том, с какой скоростью изменяются изучаемые явления во времени: чем круче наклон и соответственно чем меньше внешний угол сглаженной кривой с осью абсцисс, тем больший путь проходит за единицу времени изменяющийся процесс. Это хорошо видно на рис. 5.

       
 
Относительно медленное движение
 
Относительно быстрое движение

 


Единица времени

 

Рис.5

Точные сведения о мере наклона отрезка прямой, полученного после сглаживания, да­ет метод наименьших квадратов.

Для получения пара­метров отрезка прямой нужно обратиться к от­ношению единиц време­ни (х) и показателей раз­вивающего процесса (у).

Для нахождения па­раметров отрезка прямой, который после сглаживания представит основную тенденцию изменяющегося ряда, проделываются вычисле­ния по определенным формулам.

Формула прямой: у = а + bх, где у означает показатели ряда, х — единицы времени, по которым прослеживаются изменения изучае­мого ряда. Надлежит узнать величины а и b. Величина а необходи­ма для установления точки, с которой берет свое начало отрезок прямой, b — необходимо для установления степени наклона отрезка прямой по отношению к оси абсцисс (оси иксов).

Для вычисления вышеуказанных параметров а и b имеется сис­тема двух уравнений с двумя неизвестными:

па + å xb = å у;

å xa + å x 2 b = å ху;

х и у в этой формуле рассчитываются из фактических данных изу­чаемого ряда.

Порядок вычислений. Шестиклассники Саня и Толя в течение пяти дней упражнялись в бросках мяча в корзину. Показатели Сани приведены в таблице (х — единица времени, у число попаданий мячом в корзину. В таблице приведены вычисления и других, тре­буемых формулой, величин; п = 5).

х у х 2 ху
       
       
       
       
       

 

å x = 15; å у = 26; å x 2 = 55; å ху = 89 5 a + 15b = 26;

15 a + 55 b = 89.

Нахождение неизвестных а и b производится обычным способом исключения одного неизвестного. Члены первого уравнения для этого умножаются на 3

15 a + 45 b = 78.

Из второго уравнения вычитается первое, вычисляем b:

10 b = 11; b = 1,1.

Подставив числовое значение b в первое уравнение, можно полу­чить числовое значение а:

5 a + 16,5 = 26;

5 a = 9,5; a = 1,9.

Поскольку известны оба параметра отрезка прямой, можно опре­делить все значения параметров по пяти точкам, по формуле у = 1,9 + 1,1 х.

y 1 = 1,9 + 1,1 =3,0;

y 2 = 1,9 + 2,2=4,1;

y 3 = 1,9 + 3,3=5,2;

y 4 = 1.9 + 4,4 = 6,3;

y 5 =1,9 + 5,5=7,4.

Как было сказано ранее, сверстник Сани Толя упражнялся в том же умении. Так же, как и у Сани, количество дней упражнения бы­ло равно 5. Ниже приводятся результаты Толи и показаны все дру­гие величины, которые необходимы для вычисления величин, тре­буемых формулой.

х у х 2 ху
       
       
       
       
       

 

å x = 15; å y = 32; å x2 = 55; åxy =112.

Обозначения здесь такие же, что и в предыдущем примере. Бук­вы заменяются их числовыми значениями.

5 a + 15 b = 32;

15 a + 55 b = 112.

Члены первого уравнения умножаются на 3

15 a + 45 b = 96.

Из второго уравнения вычитается первое, получим значение b:

10 b= 16; b= 1,6.

Из первого уравнения получаем значение а:

5 a + 24 = 32;

5 a = 8; a = 1,6.

Можно получить сглаженные показатели по дням упражнений у Толи. y 1 = 1,6 + 1,6=3,2;

y 2 = 1,6+3,2=4,8;

y 3 = 1,6 + 4,8 = 6,4;

y 4 = 1,6 + 6,4 = 8,0;

y 5 = 1,6+ 8,0=9,6.

 

 

На рис. 6 показаны только результаты сглаживания. Следует обратить внимание на то, как различаются отрезки прямой по их наклону по отношению к оси абсцисс. Дан­ные Толи изображены пунктирной прямой.

Таковы способы обработки задач третьего типа.

 

 

Задачи, встающие перед психологом, который работает в области психологи­ческой диагностики, составляют четвер­тый тип задач.

Они относятся к конструированию диагностических методик, к их применению и обработке. Американская психологическая ассоциация (АПА) периодически издает «Стандартные требования к педагогическим и психологическим тестам», специальный кодекс требований к диагностическим методикам; это пособие полезно как для авторов методик, так и для тех, кто методиками пользуется.

Некоторые из этих требований могут считаться дискуссионными, но полезность кодекса в целом несомненна. Его выполнение, с одной сто­роны, обеспечивает объективность методик и их обоснованность, а с другой — препятствует проникновению в арсенал методик психологи­ческой диагностики дилетантских поделок, произвольных наборов все­возможных заданий, заимствованных из популярных журналов или со­чиненных самим автором. Самые общие и самые необходимые к испол­нению требования можно было бы свести всего к двум: диагностиче­ские методики должны быть надежными и валидными. Значение этих терминов было дано в предыдущих главах. Реализация этих требований осуществляется посредством прочно вошедших в психологическую ди­агностику статистических методов (Как было показано в гл. XI, при работе с критериально-ориентированными методиками при их конструировании и проверке возможны другие подходы).

Чтобы получить коэффициент надежности, характеризующий го­могенность методики, ее внутреннюю согласованность, прибегают к приему, называемому расщеплением. Эксперимент проводится с вы­боркой желательно порядка 100, но не менее 50 испытуемых. Полу­ченные от каждого участника выборки ответы на вопросы или ре­шения заданий делятся на четные и нечетные — по их нумерации в методике. По каждой половинке методики выписывается число пра­вильно выполненных каждым испытуемым заданий. Два эти ряда коррелируют между собой.

Допустим, что методика состоит из 24 заданий. Тогда максимальное число выполненных заданий в каждой половинке будет равно 12. Приводим результаты первых 16 испытуемых и технику вычисления коэффициента надежности (гомогенности) r (табл. 8).

Таблица 8

ВЫЧИСЛЕНИЕ КОЭФФИЦИЕНТА НАДЕЖНОСТИ МЕТОДИКИ А (ГОМОГЕННОСТЬ)

Испыту­емые Правильно решены задания Ранг заданий d d2
четные нечетные четных нечетных
А     10,5 13,5    
Б       8,5 0,5 0,25
В       6,5 3,5 12,25
Г            
Д     12,5 15,5    
Е            
Ж       15,5 0,5 0,25
        8,5 0,5 0,25
И     6,5 6,5    
К            
Л     6,5   2,5 6,25
M     12,5   1,5 2,25
Н            
О            
П     10,5 13,5    
Р            

å d 2 = 82,5

Проделана обычная ранговая корреляция. По таблице уровней значимости r0,99 = 0,64; полученный коэффициент превышает эту величину. Принято считать, что коэффициент надежности не дол­жен быть ниже 0,8. Полученный коэффициент удовлетворяет этому требованию (Применение коэффициента корреляции для нахождения коэффициента на­дежности-гомогенности путем сопоставления числа правильных решений по четным заданиям и числа правильных решений по нечетным заданиям некото­рые авторы находят недостаточно корректным, поскольку порядок, в котором представлены коррелируемые ряды, может быть случайным, он может быть произвольно изменен. Однако никакого другого приема для установления этого вида надежности в «Стандартных требованиях к педагогическим и психологиче­ским тестам» не дается. Нахождение коэффициента надежности-стабильности указанной недостаточной корректностью не грешит).

Есть поправочная формула Спирмена—Брауна к коэффициенту на­дежности-гомогенности, получаемому путем расщепления. Поскольку при прочих равных условиях получаемый коэффициент будет тем вы­ше, чем больше заданий содержится в методике, следует принять во внимание, что прием расщепления уменьшает число заданий вдвое — на этом основывается данный прием. Поправочная формула

в нашем примере

 
 


где rSB — коэффициент с учетом поправки, а — коэффициент, вычисленный при коррелировании двух половинок методики. Если этот последний равен 0,88, то после поправки Спирмена—Брауна коэффициент будет равен 0,94.

Поправочную формулу Спирмена—Брауна можно применять только в тех случаях, когда методика делится на половинки (расщепление). Если же в методике в процессе обработки не меня­ют число заданий, то поправочная формула не применяется.

Величина коэффициента надежности-гомогенности зависит от со­циально-психологических особенностей той выборки, по результа­там испытания которой этот коэффициент устанавливался. Поэтому при опубликовании методики, приводя ее основные характеристики, автору следует указать, на каком контингенте проводилась проверка надежности.

При вычислении коэффициента надежности методики, характери­зующего стабильность данных, получаемых с помощью этой мето­дики, первый коррелируемый ряд представляет собой результаты первого, а второй — повторного испытания: его рекомендуют про­водить примерно через шесть недель после первого. При необходи­мости этот срок может изменяться. Эти два ряда коррелируют меж­ду собой. Корреляция проводится по обычным правилам, о них со­общалось выше. Это прием «тест-ретест».

Для установления надежности методики существуют и некоторые другие приемы. Так, для получения коэффициента надежности практикуется прием параллельных форм. Авторы, конструирующие методику, создают две ее формы; условно назовем их формой А и формой Б. Обе формы должны быть однородны по психологической направленности, по доступности содержания заданий и по их труд­ности. В одном варианте формы Л и Б предъявляются испытуемым одна за другой, причем в одной половине выборки испытуемым сна­чала предлагается форма А, а за ней форма Б, а в другой половине выборки, наоборот, сначала форма Б, а затем А. Результаты, полу­ченные по той и другой форме, коррелируют между собой, и полу­ченный коэффициент трактуется как коэффициент надежности. Не­трудно заметить, что этот прием близок приему расщепления с той разницей, что методика как бы удвоена и сравниваются не четные и нечетные задания, а две половины этой удвоенной методики. Это дает право трактовать получаемый коэффициент скорее как коэффициент надежности-гомогенности, а не надежности-стабильности. Поскольку проверке подвергается набор заданий в целом, поправочную формулу Спирмена—Брауна применять не следует.

Другой вариант использования приема параллельных форм состо­ит- в том, что одна из форм предлагается испытуемым через какой-то интервал времени после другой, что сближает этот прием с приемом «тест-ретест». При проведении этого приема необходимо убедиться в том, что обе формы высоко коррелируют между собой, согласно только что изложенному приему по надежности-Гомоген­ности. Результаты обоих испытаний затем коррелируют. Получен­ный коэффициент может трактоваться как коэффициент надежно­сти-стабильности. Выше указывалось, что в приеме «тест-ретест» рекомендуется интервал между испытаниями шесть недель. Для этого варианта приема параллельных форм этот интервал может быть уменьшен, так как испытуемый при выполнении заданий не сможет опираться на память.

Из предшествующего изложения явствует, что в приемах уста­новления надежности главную роль играет статистический метод корреляций. Несколько по-иному обстоят дела при проверке валид­ности методики.

Если показатели того критерия, который взят для получения ко­эффициента внешней валидности, имеют примерно ту же меру рас­сеяния, меру вариативности, что и мера рассеяния показателей са­мой методики, то применение корреляции правомерно. Допустим, автор методики намерен установить ее валидность, сравнивая ус­пешность выполнения методики с учебной деятельностью. Валид­ность устанавливается на выборке школьников. В этом случае, как показывает практика, суммарные оценки за одну учебную четверть или за полугодие покажут примерно тот же размах колебаний, что и размах колебаний по методике; методика состоит из 20 заданий, и при ее выполнении показан размах колебаний от 3 до 20. Суммар­ные оценки успеваемости, после того как они подсчитаны за полго­да, имеют размах колебаний порядка от 14 до 36. Такие ряды впол­не возможно коррелировать.

Но в некоторых случаях для получения коэффициента валидно­сти приходится сравнивать успешность выполнения диагностиче­ской методики, допустим, в тех же пределах колебаний — от 3 до 20, и производственные достижения, которые имеют всего три сту­пени оценок: ниже средних, средние и выше средних. Корреляцией в этом случае воспользоваться нельзя, если иметь в виду линейную корреляцию, о которой идет речь в этой главе. Однако могут быть использованы некоторые другие статистические методы, показы­вающие существование или отсутствие связи между распределени­ем двух рядов численностей. Простейший способ получения коэф­фициента валидности в описываемом случае и в других подобных случаях — метод «хи-квадрат». Всех испытуемых, прошедших диагностический эксперимент, делят на три равные группы — их и со­поставляют с тремя группами, на которые были поделены испытуе­мые при оценке их профессиональной успеваемости.

В изучаемой выборке — 90 человек. Они делятся по профессио­нальным достижениям на три группы: первая — в ней 30 испытуе­мых — лица с профессиональными достижениями ниже среднего уровня; вторая — 40 испытуемых — это лица со средними дости­жениями, и третья — 20 испытуемых, их достижения выше средне­го уровня. Первая группа составляет 33,3% выборки, вторая — 44,4 и третья — 22,2%.

Приводим технику вычисления (табл. 9).

Таблица 9

Психологическая оценка Оценка профессиональных достижений Всего
Ниже среднего Средняя Выше среднего
Ниже среднего А (10) В (13,3) С (6,7)  
Средняя D (10) Е (13,3) F (6,7)  
Выше среднего G (10) Н (13,3) J (6,7)  
Итого:        

 

Эксперимент, данные которого представлены в табл. 8, предпри­нимался, чтобы установить валидность психологической оценки. Нуль-гипотеза формулируется так: психологическая оценка не име­ет никакого значения для профессиональных достижений; поэтому она никак не скажется на распределении численностей в таблице-графике «хи-квадрат»;

Принятие нуль-гипотезы может произойти в том случае, если в каждой из групп по профессиональной успешности испытуемые бу­дут распределены независимо от их психологической оценки. Тогда испытуемые, получившие психологическую оценку «ниже среднего», распределятся по всем трем группам в тех же процентных отноше­ниях, в каких они распределились и по профессиональным дости­жениям. Напомним эти отношения: 33,3 — 44,4 — 22,2. Психоло­гическую оценку «ниже среднего» получили всего 30 испытуемых. 33,3% этого числа (10 человек) должны были бы попасть в группу с профессиональными достижениями ниже среднего уровня, с дос­тижениями среднего уровня — 44,4% (в среднем 13,3), с достиже­ниями выше среднего уровня — 22,2% (6,7).

Те же рассуждения повторяются и относительно испытуемых, имеющих психологические оценки «среднюю» и «выше среднего». Однако наблюдается иное распределение. Возникает вопрос: можно ли, учитывая фактическое распределение, отвергнуть нуль-гипотезу и признать, что психологическая оценка влияет на профессиональ­ные достижения? Это раскроет методика «хи-квадрат».

В клетках таблицы представлены как фактически наблюдаемые численности, так и предполагаемые согласно нуль-гипотезе; они за­ключены в скобки.

Как известно, формула хи-квадрат такова:

где f 0 — фактически наблюденные численности, f e — предполагае­мые численности.

Для получения значения хи-квадрат нужно суммировать по клет­кам:

Клетки

x 2 = 10 + 5,2 + 0,4 + 2,5 + 0,2 + 1,6 + 2,5 + 3,7 + 0,4 = 26,5, fd — число степеней свободы.

В этом примереc = - 1)(с - 1) = (3 - 1)(3 - 1) = 4.

x2 0,99 при 4 степенях свободы равно 11,34.

Сравнивая полученную в эксперименте величину x2 с величиной x2 0,99, указанной в таблице значимостей, можно заключить: полу­ченная в эксперименте величина (x2 = 26,5) свидетельствует о ва­лидности примененной психологической методики.

Величина хи-квадрат с указанием ее значимости служит в подоб­ных случаях показателем или коэффициентом валидности. Этот же метод применяется, если оценка дается не по трем ступеням, как в рассмотренном примере, а по пяти (значительно ниже средней, ни­же средней, средняя, выше средней, значительно выше средней и т.д.). Техника вычислений при такой дифференциации оценок ана­логична показанной выше.

Были изложены четыре типа задач и показаны статистические методы, применяемые для каждого типа. В современной диагности­ке применяются не только перечисленные в этой главе статистиче­ские методы, но и многие другие. Однако можно полагать, что, ог­раничив свою цель изложением простейших статистических мето­дов, нет необходимости обращаться к сложным и сложнейшим. Чи­татели, заинтересовавшиеся проблемами статистических методов в диагностике, могут обратиться к другим пособиям и источникам.

Элементы планирования в психологических исследова­ниях. Нельзя начинать исследование, не уяснив его цель. Это ак­сиома. Однако наблюдения показывают, что не все ее принимают. Нередко можно обнаружить смешение двух категорий целей: цель исследования и цель исследователя. Но полное доминирование цели исследователя и безразличное отношение к цели исследования не должны иметь места. Планирование должно исходить из цели ис­следования.

Есть два главных источника, стимулирующих возникновение ис­следований: либо они отвечают на запросы, выдвигаемые практи­кой, которую обслуживает данная наука, либо они возникают из нужд самой науки и имеют целью совершенствовать познание тех сфер жизни, которым посвящена данная наука. Стоит отметить, что детальное планирование необходимо и в том, и в другом случае. Мнение, будто практические исследования могут проводиться без за­ранее продуманного плана, безусловно, ошибочно; только правильно спланированное исследование может в своих выводах дать ответ на те вопросы, ради решения которых оно и задумывалось.

Различают планирование исследований, не нуждающихся в экс­перименте, и исследований, включающих эксперимент как необхо­димую часть. Что касается первых, то их



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2019-08-04 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: