Вычисление коэффициента корреляции по Спирмену (коэффициент ранговой корреляции).




ПРОСТЕЙШИЕ МЕТОДЫ

СТАТИСТИЧЕСКОЙ ОБРАБОТКИ МАТЕРИАЛОВ ПСИХОЛОГИЧЕСКИХ ИССЛЕДОВАНИЙ

Статистические методы применяются при обработке материалов психологических исследований для того, чтобы извлечь из тех ко­личественных данных, которые получены в экспериментах, при оп­росе и наблюдениях, возможно больше полезной информации. В ча­стности, в обработке данных, получаемых при испытаниях по пси­хологической диагностике, это будет информация об индивидуаль­но-психологических особенностях испытуемых. Вообще психологи­ческие исследования обычно строятся с опорой на количественные данные. Вот пример.

К школьному психологу обратился шестиклассник Саня Ю. с прось­бой испытать его двигательный темп. Саню очень интересовал бас­кетбол, и он собирался вступить в баскетбольную команду, а бас­кетболист, несомненно, должен иметь высокий двигательный темп. Психолог разработал план небольшого исследования. Он начал с того, что попросил Саню так быстро, как он только может, ставить точки в центре кружков, нарисованных на листке бумаги. За одну минуту Саня поставил 137 точек. Насколько этот темп характерен для Сани? Чтобы установить это, психолог попросил Саню повто­рить эту пробу 25 раз. Действительно, некоторые результаты пре­вышали первоначально полученное число, но некоторые оказались и поменьше. Психолог просуммировал все полученные за 25 проб ре­зультаты, а сумму разделил на 25 — таким путем он получил сред­нее арифметическое по всем пробам. Это среднее арифметическое составило 141. Таков по этой пробе максимальный темп Сани. Можно ли считать этот темп высоким? Потребовался еще один шаг в исследовании. Психолог сформировал группу из 50 шестиклассни­ков, не отличающихся ни от Сани, ни друг от друга по возрасту бо­лее чем на полгода. С этими ребятами психолог также провел сна­чала по несколько тренировочных проб, чтобы получить надежные данные об их темпе, и, наконец, последнюю пробу, для обработки.

Все эти экспериментальные данные в виде средних арифметиче­ских были построены в один порядковый ряд, который был разбит по десяткам (по децилям). Санины данные вышли в десятку с наи­более быстрыми результатами. По этим количественным данным психолог сделал вывод о том, что Саня обладает сравнительно вы­соким двигательным темпом, о чем и было ему сообщено.

Современная математическая статистика представляет собой большую и сложную систему знаний. Нельзя рассчитывать на то, что каждый психолог, сделавший диагностику своей специально­стью, овладеет этими знаниями. Между тем статистика нужна пси­хологу постоянно в его повседневной работе. Специалисты-статис­тики разработали целый комплекс простых методов, которые со­вершенно доступны любому человеку, не забывшему то, что он вы­учил еще в средней школе.

В зависимости от требований, которые предъявляют к статистике различные области науки и практики, создаются пособия по геоло­гической, медицинской, биологической, психологической статисти­ке. (См., например: Суходольский Г.В. Основы математической ста­тистики для психологов. Л., 1972). В этой главе даются простейшие методы статистики для психологов. Все необходимые для их приме­нения вычисления можно выполнять на ручном компьютере, а то и на простых счетах. Уместное, грамотное применение этих методов позволит практику и исследователю, проведя начальную обработку, получить общую картину того, что дают количественные результаты его исследований, оперативно проконтролировать ход исследований. В дальнейшем, если возникнет такая необходимость, материалы ис­следований могут быть переданы для более глубокой разработки специалисту-статистику на большой компьютер.

Статистические шкалы. Применение тех или других статисти­ческих методов определяется тем, к какой статистической шкале относится полученный материал. С. Стивене предложил различать четыре статистические шкалы: шкалу наименований (или номина­тивную), шкалу порядка, шкалу интервалов и шкалу отношений.

Зная типические особенности каждой шкалы, нетрудно устано­вить, к какой из шкал следует отнести подлежащий статистической обработке материал.

Шкала наименований. К этой шкале относятся материалы, в которых изучаемые объекты отличаются друг от друга по их каче­ству. При обработке таких материалов нет никакой нужды в том, чтобы располагать эти объекты в каком-то порядке, исходя из их характеристик. В принципе объекты можно располагать в любой последовательности. Вот пример: изучается состав международной научной конференции. Среди участников есть французы, англичане, датчане, немцы и русские (рис. 1). Имеет ли значение порядок, в котором будут расположены участники при изучении состава кон­ференции? Можно распо­ложить их по алфавиту, это удобно, но ясно, что ника­кого принципиального зна­чения в этом расположении нет. При переводе этих ма­териалов на другой язык (а значит, и на другой алфа­вит) этот порядок будет нарушен. Можно располо­жить национальные группы по числу участников. Но при сравнении этого материала с материалом другой конференции найдем, что вряд ли этот порядок окажется таким же. Отнесенные к шкале на­именований объекты можно размещать в любой последовательности в зависимости от цели исследования.

При статистической обработке такого рода материалов нужно считаться с тем, каким числом единиц представлен каждый объект. Имеются весьма эффективные статистические методы, позволяю­щие по этим числовым данным прийти к научно значимым выводам (например, метод хи-квадрат).

Шкала порядка. Если в шкале наименований порядок следова­ния изучаемых объектов практически не играет никакой роли, то в шкале порядка — это видно из ее названия — именно на эту по­следовательность переключается все внимание. К этой шкале в ста­тистике относят такие исследовательские материалы, в которых рассмотрению подлежат объекты, принадлежащие к одному или не­скольким классам, но отличающиеся при сравнении одного с другим: больше—меньше, выше—ниже и т.п.

Проще всего показать типические особенности шкалы порядка, если обратиться к публикуемым итогам любых спортивных соревно­ваний. В этих итогах последовательно перечисляются участники, занявшие соответственно первое, второе, третье и прочие по поряд­ку места. Но в информации об итогах соревнований нередко отсут­ствуют или отходят на второй план сведения о фактических дости­жениях спортсменов, а на первый план ставятся их порядковые места. Допустим, шахматист Д. занял в соревнованиях первое ме­сто. Каковы же его достижения? Оказывается, он набрал 12 очков. Шахматист Е. занял второе место. Его достижение — 10 очков.

Третье место занял Ж. с 8 очками, четвертое — З. с 6 очками и т.д. В сообщениях о соревновании разница в достижениях при разме­щении шахматистов отходит на второй план, а на первом остаются их порядковые места. В том, что именно порядковому месту отво­дится главное значение, есть свой смысл. В самом деле, в нашем примере 3. набрал 6, а Д. — 12 очков. Это абсолютные их дости­жения — выигранные ими партии. Если попытаться истолковать эту разницу в достижениях чисто арифметически, то пришлось бы признать, что 3. играет вдвое хуже, чем Д. Но с этим нельзя согла­ситься. Обстоятельства соревнований не всегда просты, как не все­гда просто и то, как провел их тот или другой участник. Поэтому, воздерживаясь от арифметической абсолютизации, ограничиваются тем, что устанавливают: шахматист 3. отстает от занявшего первое место Д. на три порядковых места.

Заметим, что в других соревнованиях расклад абсолютных дос­тижений может быть иным: занявший первое место может всего на пол-очка опережать ближайших участников. Важно, что он набрал наибольшее количество очков. Только от этого зависит его порядко­вое место.

Шкала интервалов. К ней относятся такие материалы, в которых дана количественная оценка изучаемого объекта в фиксированных еди­ницах. Вернемся к опытам, которые провел психолог с Саней. В опытах учитывалось, сколько точек может поставить, работая с максимально доступной ему скоростью, сам Саня и каждый из его сверстников. Оценочными единицами в опытах служило число точек. Подсчитав их, исследователь получил то абсолютное число точек, которое оказалось возможным поставить за отведенное время каждому участнику опытов. Главная трудность при отнесении материалов к шкале интервалов со­стоит в том, что нужно располагать такой единицей, которая была бы при всех повторных измерениях тождественной самой себе, т.е. одина­ковой и неизменной. В примере с шахматистами (шкала порядка) такой единицы вообще не существует.

В самом деле, учитывается число партий, выигранных каждым участником соревнований. Но ясно, что партии далеко не одинако­вы. Возможно, что участник соревнований, занявший четвертое ме­сто — он выиграл шесть партий, — выиграл труднейшую партию у самого лидера! Но в окончательных итогах как бы принимается, что все выигранные партии одинаковы. В действительности же этого нет. Поэтому при работе с подобными материалами уместно их оценивать в соответствии с требованиями шкалы порядка, а не шкалы интервалов. Материалы, соответствующие шкале интерва­лов, должны иметь единицу измерения.

Шкала отношений. К этой шкале относятся материалы, в ко­торых учитываются не только число фиксированных единиц, как в шкале интервалов, но и отношения полученных суммарных итогов между собой. Чтобы работать с такими отношениями, нужно иметь некую абсолютную точку, от которой и ведется отсчет. При изуче­нии психологических объектов эта шкала практически неприменима.

О параметрических и непараметрических методах стати­стики. Приступая к статистической обработке своих исследований, психолог должен решить, какие методы ему более подходят по осо­бенностям его материала — параметрические или непараметриче­ские. Различие между ними легко понять. Вспомним, что говори­лось об измерении двигательной скорости шестиклассников. Как обработать эти данные? Нужно записать все произведенные изме­рения — в данном случае это будет число точек, поставленных ка­ждым испытуемым, — затем требуется вычислить для каждого ис­пытуемого среднее арифметическое по результатам опытов. Далее следует расположить все эти данные в их последовательности, на­пример, начиная с наименьших к наибольшим. Для облегчения обо­зримости этих данных их обычно объединяют в группы; в этом слу­чае можно объединить по 5—9 измерений в группе. Вообще же при таком объединении желательно, если общее число случаев не более ста, чтобы общее число групп было порядка двенадцати. Получи­лась такая таблица (с. 249).

Далее нужно установить, сколько раз в опытах встретились чи­словые значения, соответствующие каждой группе. Сделав это, нужно для каждой группы записать ее численность. Полученные в такой таблице данные носят название распределения численностей. Рекомендуется представить это распределение в виде диаграммы — полигона распределения. Контуры этого полигона помогут решить вопрос о статистических методах обработки. Нередко они напоми­нают контуры колокола, с наивысшей точкой в центре полигона и с симметричными ветвями, отходящими в ту и другую сторону. Такой контур соответствует кривой нормального распределения. Это поня­тие было введено в математическую статистику К.Ф. Гауссом (1777—1855), поэтому кривую именуют также кривой Гаусса. Он же дал математическое описание этой кривой. Для построения кри­вой Гаусса (или кривой нормального распределения) теоретически требуется очень большое количество случаев. Практически же при­ходится довольствоваться тем фактическим материалом, который накоплен в исследовании. Если данные, которыми располагает ис­следователь, при их внимательном рассмотрении или после перено­са их на диаграмму, лишь в незначительной степени расходятся с кривой нормального распределения, то это дает право исследовате­лю применять в статистической обработке параметрические методы, исходные положения которых основываются на нормальной (О математически обоснованных способах определения того, можно ли считать данное распределение нормальным, см., например, в кн.: Урбах В.Ю. Математиче­ская статистика для биологов и медиков. М., 1963. С. 66) кривой распределения Гаусса. Нормальное распределение называют пара­метрическим потому, что для построения и анализа кривой Гаусса достаточно иметь всего два параметра: среднее арифметическое, значение которого должно соответствовать высоте перпендикуляра, восстановленного в центре кривой, и так называемое среднее квад-ратическое, или стандартное, отклонение — величины, характери­зующей размах колебаний данной кривой; о способах вычисления той и другой величины будет далее рассказано.

Параметрические методы обладают для исследователя многими преимуществами, но нельзя забывать о том, что применение их правомерно только тогда, когда обрабатываемые данные показывают распределение, лишь несущественно отличающееся от гауссова.

При невозможности применить параметрические методы, надлежит обратиться к непараметрическим. Эти методы успешно разрабаты­вались в последние 3—4 десятилетия, и их разработка была вызва­на прежде всего потребностями ряда наук; в частности, психологии. Они показали свою высокую эффективность. Вместе с тем они не требуют сложной вычислительной работы.

Современному психологу-исследователю нужно исходить из того, что «существует большое количество данных либо вообще не под­дающихся анализу с помощью кривой нормального распределения, либо не удовлетворяющих основным предпосылкам, необходимым для ее использования» (Рунион Р. Справочник по непараметриче­ской статистике. М., 1982. С. 11.).

Генеральная совокупность и выборка. Психологу постоянно придется иметь дело с этими двумя понятиями. Генеральная сово­купность, или просто совокупность, — это множество, все элемен­ты которого обладают какими-то общими признаками. Так, все под­ростки-шестиклассники 12 лет (от 11,5 до 12,5) образуют совокуп­ность. Дети того же возраста, но не обучающиеся в школе, или же обучающиеся, но не в шестых классах, не подлежат включению в эту совокупность.

В ходе конкретизации проблем своего исследования психологу неизбежно придется обозначить границы изучаемой им совокупно­сти. Следует ли включать в изучаемую совокупность детей того же возраста, но обучающихся в колледжах, гимназиях, лицеях и других подобных учебных заведениях? В ответе на этот и на другие такие же вопросы может помочь статистика.

В подавляющем большинстве случаев исследователь не в состоя­нии охватить в изучении всю совокупность. Приходится, хотя это и связано с некоторой утратой информации, взять для изучения лишь часть совокупности, ее и называют выборкой. Задача исследователя заключается в том, чтобы подобрать такую выборку, которая репре­зентировала бы, представляла совокупность; другими словами, при­знаки элементов совокупности должны быть представлены в выбор­ке. Составить такую выборку, в точности повторяющую все разно­образные сочетания признаков, которые имеются в элементах сово­купности, вряд ли возможно. Поэтому некоторые потери в инфор­мации оказываются неизбежными. Важно, чтобы в выборке были сохранены существенные, с точки зрения данного исследования, признаки совокупности. Возможны случаи, и для их обнаружения есть статистические методы, когда задачи исследования требуют создания двух выборок одной совокупности; при этом нужно уста­новить, не взяты ли выборки из разных совокупностей. Эти и дру­гие подобные казусы нужно иметь в виду психологу при обработке результатов выборочных исследований.

Следует рассмотреть типы задач, с которыми чаще всего имеет дело психолог. Соответственно приводятся и статистиче­ские методы, которые приложимы для обработки психологических материалов, направленных на решение этих задач.

Первый тип задач. Психологу нужно дать сжатую и достаточ­но информативную характеристику психологических особенностей какой-то выборки, например, школьников определенного класса. Чтобы подойти к решению этой задачи, необходимо располагать ре­зультатами диагностических испытаний; эти испытания, разумеется, следует заранее спланировать так, чтобы они давали информацию о тех особенностях группы, которые в этом конкретном случае инте­ресуют психолога. Это могут быть особенности умственного разви­тия, психофизиологические особенности, данные об изменении ра­ботоспособности и т.д.

Получив все экспериментальные результаты и материалы наблю­дений, следует подумать о том, как их подать пользователю в ком­пактном виде, чтобы при этом свести к минимуму потерю информа­ции. В перечне статистических методов, используемых при решении подобных задач, обычно находят свое место и параметрические и непараметрические методы, о возможностях применения тех и дру­гих, как было сказано выше, судят по полученному материалу. Об этих статистических методах и их использовании пойдет речь ниже.

Второй тип задач. Это, пожалуй, наиболее часто встречающие­ся задачи в исследовательской и практической деятельности психолога: сравниваются между собой несколько выборок, чтобы установить, являются ли выборки независимыми или принадлежат одной и той же совокупности. Так, проведя эксперименты в восьмых классах двух раз­личных школ, психолог сравнивает эти выборки между собой.

К этому же типу относятся задачи с определением тесноты связи двух рядов показателей, полученных на одной и той же выборке; в такой обработке чаще всего применяют метод корреляций.

Третий тип задач — это задачи, в которых обработке подлежат временные ряды, в них расположены показатели, меняющиеся во времени; их называют также динамическими рядами. В предшест­вующих типах задач фактор времени не принимался во внимание и ма­териал анализировался так, как будто он весь поступил в руки иссле­дователя в одно и то же время. Такое допущение можно оправдать тем, что за тот короткий период времени, который был затрачен на собира­ние материала, он не потерпел существенных изменений. Но психологу приходится работать и с таким материалом, в котором наибольший ин­терес представляют как раз его изменения во времени. Допустим, пси­холог намерен изучить изменение работоспособности школьников в те­чение учебной четверти. В этом случае информативными будут показа­тели, по которым можно судить о динамике работоспособности. Берясь за такой материал, психолог должен понимать, что при анализе дина­мических рядов нет смысла пользоваться средним арифметическим ря­да, так как оно замаскирует нужную информацию о динамике.

В предыдущих главах упоминалось о лонгитюдинальном исследо­вании, т.е. таком, в котором однообразный по содержанию психоло­гический материал по одной выборке собирается в течение дли­тельного времени. Показатели лонгитюда — это также динамиче­ские ряды, и при их обработке следует пользоваться методами, предназначенными для таких рядов.

Четвертый тип задач — задачи, возникающие перед психоло­гом, занимающимся конструированием диагностических методик, проверкой и обработкой результатов их применения. Отчасти об этих задачах уже говорилось в других главах, но не уделялось вни­мания специально статистике. Психологическая диагностика, в осо­бенности тестология, имеет целый ряд канонических правил, при­менение которых должно обеспечивать высокое качество информа­ции, получаемой посредством диагностических методик. Так, мето­дика должна быть надежной, гомогенной, валидной. По упрочив­шимся в тестологии правилам, все эти свойства проверяются стати­стическими методами.

Здесь уместно высказать некоторые соображения о возможностях статистики в проведении психологического исследования.

Статистика как таковая не создает новой научной информации. Эта информация либо содержится, либо не содержится (к сожале­нию, и так бывает) в полученных исследователем материалах. На­значение статистики состоит в том, чтобы извлечь из этих материа­лов больше полезной информации. Вместе с тем статистика показы­вает, что эта информация не случайна и что добытые данные имеют определенную и значимую вероятность.

Статистические методы раскрывают связи между изучаемыми явле­ниями. Однако необходимо твердо знать, что как бы ни была высока вероятность таких связей, они не дают права исследователю признать их причинно-следственными отношениями. Статистика, как о ней пи­шут известные английские ученые Д.Э. Юл и М.Дж. Кендэл (Теория статистики. М., 1960. С. 18—19.), «вынуждена принимать к анали­зу данные, подверженные влиянию множества причин». Статистика, например, утверждает, что существует значимая связь между дви­гательной скоростью и игрой в теннис. Но отсюда еще не вытекает, будто двигательная скорость и есть причина успешной игры. Нель­зя, по крайней мере в некоторых случаях, исключить и того, что сама двигательная скорость явилась следствием успешной игры.

Чтобы подтвердить или отвергнуть существование причинно-следственных отношений, исследователю зачастую приходится про­думывать целые серии экспериментов. Если они будут правильно построены и проведены, то статистика поможет извлечь из резуль­татов этих экспериментов информацию, которая необходима иссле­дователю, чтобы либо обосновать и подтвердить свою гипотезу, ли­бо признать ее недоказанной.

Вот что нужно знать при использовании статистики.

Итак, были перечислены типы задач, с которыми чаще всего встречаются психологи. Теперь перейдем к изложе­нию конкретных статистических методов, которые способ­ствуют успешному решению перечисленных задач.

Первый тип задач. Статистические методы, примеры их при­менения для принятия решения.

Допустим, школьному психологу нужно представить краткую ин­формацию о развитии психомоторных функций учащихся 6-х классов, в которых обучается 50 учеников. В процессе выполнения своей про­граммы психолог провел диагностическое изучение двигательной ско­рости, применив методику, которая была описана выше (С. 240).

Для реализации своей программы психологу надлежало получить количественные характеристики, свидетельствующие о состоянии изучаемой функции — ее центральной тенденции, величины, пока­зывающей размах- колебаний, в пределах которого находятся все данные отдельных учеников, и то, как распределяются эти данные.

Какими методами вести обработку — параметрическими или непара­метрическими? Визуальное ознакомление с полученными данными по­казывает, что возможно применение параметрического метода, т.е. бу­дут вычислены среднее арифметическое, выражающее центральную тенденцию, и среднее квадратическое отклонение, показывающее раз­мах и особенности варьирования экспериментальных результатов.

Нельзя ограничиться вычислением только среднего арифметиче­ского, так как оно не дает полных сведений об изучаемой выборке. Вот пример. В одном купе вагона поместилась бабушка 60 лет с че­тырьмя внуками: 4 лет, двое по 5 и 6 лет. Среднее арифметическое возраста всех пассажиров этого купе 80/5 = 16.

В другом, купе расположилась компания молодежи: двое 15-летних, 16-летний и двое 17-летних. Средний возраст пассажиров этого купе также равен 16. Таким образом, по средним арифмети­ческим пассажиры этих купе как бы и не различаются. Но если об­ратиться к особенностям варьирования, то сразу можно установить, что в одном купе возраст пассажиров варьирует в пределах 56 еди­ниц, а во втором — в пределах 2.

Для вычисления среднего арифметического применяется формула:

а для среднего квадратического отклонения формула:

В этих формулах х означает среднее арифметическое, х — каж­дую величину изучаемого ряда, Z — сумму; s — среднее квадрати­ческое отклонение; п — число членов изучаемого ряда.

Вернемся к опыту с проверкой двигательной скорости учащихся (С. 244).

В опытах участвовали 50 испытуемых. Каждый из них выполнил по 25 проб, по 1 минуте каждая. Вычислена средняя каждого испы­туемого. Полученный ряд упорядочен и все индивидуальные резуль­таты представлены в последовательности от меньшего к большему:

85 — 93 — 93 — 99 — 101 — 105 — 109 — 110 — 111 — 115 —

115 — 116 — 116 — 117 — 117 — 117 — 118 — 119 — 121 — 121 —

122 — 124 — 124 — 124 — 124 — 125 — 125 — 125 — 127 — 127 —

127 — 127 — 127 — 128 — 130 — 131 — 132 — 132 — 133 — 134 —

134 — 135 — 138 — 138 — 140 — 143 — 144 — 146 — 150 — 158

Для дальнейшей обработки удобнее эти первичные данные со­единить в группы, тогда отчетливее выступает присущее данному ряду распределение величин и их численностей. Отчасти упрощается и вычисление среднего арифметического и среднего квадратического отклонения. Этим искупается несущественное искажение/ информации, неизбежное при вычислениях на сгруппированные данных.

При выборе группового интервала следует принять во внимание такие соображения. Если ряд не очень велик, например содержит до 100 элементов, то и число групп не должно быть очень велико, например порядка 10—12. Желательно, чтобы при группировании начальная величина — при соблюдении последовательности от меньшей величины к большей — была меньше самой меньшей ве­личины ряда, а самая большая — больше самой большой величины изучаемого ряда. Если ряд, как в данном случае, начинается с 85, группирование нужно начать с меньшей величины, а поскольку ряд за­вершается числом 158, то и группирование должно завершаться большей величиной. В ряду, который нами изучается, с учетом высказанных со­ображений можно выбрать групповой интервал в 9 единиц и произвести разбиение ряда на группы, начав с 83. Тогда последняя группа будет за­вершаться величиной, превышающей значение последней величины ряда (т.е. 158). Число групп будет равно 9 (табл. 1).

Вычисление среднего арифметического и среднего квадратическо-го отклонения.

Таблица 1

Группы Средние значе­ния Резуль­тат раз­носки Итоги разнос­ки f•x x – x (х -x)2 f•(x -х)2
83—91   /          
92—100   u          
101—109   LJ          
110—118   QQ          
119—127   1300/          
128—136   Ш          
137—145   Я          
146—154   L          
155—163   /          
        n = 50       Σ f•x= 6150         Σ f•(x -х)2= =10368

 

1-й столбец — группы, полученные после разбиения изучаемого ряда.

2-й столбец — средние значения каждой группы; этот столбец показывает, в каком диапазоне варьируют величины изучаемого ря­да, т.е. х.

3-й столбец показывает результаты «ручной» разноски величин ряда или иксов: каждая величина занесена в соответствующую ее значению группу в виде черточки.

4-й столбец — это итог подсчета результатов разноски.

5-й столбец показывает, сколько раз встречалась каждая величи­на ряда — это произведение величин второго столбца на величины 4-го столбца по строчкам. Итоги 4-го и 5-го столбцов дают суммы, необходимые для вычисления среднего арифметического.

6-й столбец показывает разность среднего арифметического и значения x по каждой группе.

7-й столбец — квадрат этих разностей.

8-й столбец показывает, сколько раз встречался каждый квадрат разности; суммирование величин этого столбца дает итог, необхо­димый для вычисления среднего квадратического отклонения.

В заголовках 5-го и 8-го столбцов указывается, насколько часто встречается та или другая величина. Частота обозначается буквой f (от английского слова frequency).

Включение буквы f, означающей, насколько часто встречалась та или другая величина, ничего не изменяет в формулах среднего арифметического и среднего квадратического отклонения.

Поэтому формулы

вполне тождественны.

Рис.2

Остается показать, как вы­числяются по формулам сред­нее арифметическое и среднее квадратическое отклонение. Обратимся к величинам, полу­ченным в таблице:

x = 6150: 50 = 123. При составлении таблицы это число было заранее вычислено, без него нельзя было бы полу­чить числовые значения 6, 7, 8-го столбцов таблицы.

При обработке изучаемого ряда оказалось возможным примене­ние параметрического метода, так как визуально в этом ряду рас­пределение численностей приближается к нормальному. Это под­тверждается и графиком (рис. 2, с. 251).

Нормальное распределение обладает некоторыми весьма полезными для исследователя свойствами. Так, в границах x ± s находится при­мерно 68% всего ряда или всей выборки, в границах х ± 2s — пример­но 95%, а в границах x ± 3s — 97,7% выборки. В практике иссле­дований часто берут границы — x ±2/3s. В этих границах при нор­мальном распределении будут находиться 50% выборки; распреде­ление это симметрично, поэтому 25% окажутся ниже, а 25% выше границ x ±2/3s. Все эти расчеты не требуют никакой дополни­тельной проверки при условии, что изучаемый ряд имеет нор­мальное распределение, а число элементов в нем велико, поряд­ка нескольких сотен или тысяч. Для рядов, которые распределе­ны нормально или имеют распределение, мало отличающееся от нормального, вычисляется коэффициент вариации по такой фор­муле:

В примере, который был рассмотрен выше,

V= (100-14,4)/123 = 11,7.

Выполнив все эти вычисления, психолог может представить инфор­мацию об изучении двигательной скорости с помощью примененной методики в 6-х классах. Согласно результатам изучения в 6-х классах получены: среднее арифметическое — 123; среднее квадратическое от­клонение — 14,4; коэффициент вариативности — 11,7.

Непараметрические методы. Ранжирование, медиана, квартиль. Далеко не все материалы, получаемые в психологиче­ских исследованиях, подлежат обработке параметрическими мето­дами. Если после ознакомления с изучаемым рядом исследователь убеждается в том, что этот ряд не имеет свойств нормального рас­пределения, ему остается перейти на методы непараметрической статистики. С их помощью могут быть получены и центральная тенденция изучаемого ряда — медиана — и величина, позволяющая судить о диапазоне варьирования и о строении изучаемого ряда — квартильное отклонение.

Вот пример. После диагностических испытаний уровня умствен­ного развития учеников 6-го класса полученные данные были упо­рядочены, т.е. расположены в последовательности от меньшей ве­личины к большей. Испытания проходили 18 учащихся (табл. 2).

Таблица 2

Учащиеся Баллы Ранги (R) Учащиеся Баллы Ранги (R)
А     К    
Б     Л   11,5
В     М   11,5
Г     Н   14,5
Д     О   14,5
Е     П   14,5
Ж     Р   14,5
    8,5 С   17,5
И   8,5 Т   17,5

 

Примечание. Буквами обозначены учащиеся, числами — полученные ими баллы по тесту.

Процедура ранжирования состоит в следующем. Все числа ряда в их последовательности получают по своим. порядковым местам присваи­ваемые им ранги. Если какие-нибудь числа повторяются, то всем по­вторяющимся числам присваивается один и тот же ранг — средний из общей суммы занятых ими ранговых мест. Так, числу 28 в изучаемом ряду присвоен ранг 2. Затем следуют трижды повторяющиеся числа 39. На них приходятся занятые ими ранговые места 3, 4, 5. Поэтому этим числам присваивается один и тот же средний ранг, в дан­ном случае — 4. Поскольку места до 5-го включительно заняты, то следующее число получает ранг 6 и т.д.

При обработке ряда, не имеющего признаков нормального рас­пределения — непараметрического ряда, — для величины, которая выражала бы его центральную тенденцию, более всего пригодна ме­диана, т.е. величина, расположенная в середине ряда. Ее определя­ют по срединному рангу по формуле Me = (п + 1)/2, где Me оз­начает медиану, п — как в ранее приводившихся формулах — число членов ряда. При нечетном числе членов ряда ранговая медиана — целое число, при нечетном число — с 0,5. Заметим, что числовое значение медианы может и не быть в составе самого обрабатывае­мого ряда.

Возьмем к примеру ряд в семь членов: 3—5—6—7—9—10—11.

Проранжировав его, имеем: 1—2—3—4—5—6—7.

Ранговая медиана в таком ряду равна: Me = (7 + 1)/2 = 4, этот ранг приходится на величину 7.

Возьмем ряд в восемь членов: 3—5—6—7—9—10—11—12.

Проранжировав его, имеем: 1—2—3—4—5—6—7—8.

Ранговая медиана в этом ряду равна: Me = (8 + 1)/2 = 4,5.

Этому рангу соответствует середина между двумя величинами, имеющими ранг 4 и ранг 5, т.е. между 7 и 9. Медиана этого ряда равна: Me = (7 + 9)/2 = 8.

Следует обратить внимание на то, что величины 8 в составе ряда нет, но таково значение медианы этого ряда.

Вернемся к изучаемому ряду. Он состоит из 18 членов. Его ран­говая медиана равна: Me = (18 + 1)/2 = 9,5.

Она расположится между 9-й и 10-й величиной ряда. 9-я величи­на — 52, 10-я — 68. Медиана занимает срединное место между ними, следовательно, Me = (52 + 68)/2 = 60.

По обе стороны от этой величины находится по 50% величин ряда.

Характеристику распределения численностей в непараметриче­ском ряду можно получить из отношения его квартилей. Квартилью называется величина, отграничивающая 1/4 всех величин ряда. Квартиль первая — ее обозначение Q 1 вычисляется по формуле:

Это полусумма первого и последнего рангов первой — левой от медианы половины ряда;

квартиль третья, обозначаемая Q 3 вычисляется по формуле:

т.е. как полусумма первого и последнего рангов второй, правой от ме­дианы, половины ряда. Берутся порядковые значения рангов по их по­следовательности в ряду. В обрабатываемом ряду Q 1 = (1+9)/2 = 5, Q 3 = (10 + 18)/2 = 14.

Рангу 5 в этом ряду соответствует величина 39, а рангу 14 — 70. Следовательно, в данном ряду Q 1 = 39, а Q 3 = 70.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2019-08-04 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: