Перевод первичных тестовых результатов в шкалу станайнов




План

1. Понятие стандартизации теста.

2. Перевод первичных результатов теста в шкальные оценки.

3. Основные виды шкальных оценок.

Литература:

1. БОДАЛЕВ А.А., СТОЛИН В.В. Общая психодиагностика. – М., 1987.

2. БУРЛАЧУК Л.Ф., МОРОЗОВ С.М. Словарь-справочник по психологической диагностике. – М., 1998.

3. НЕМОВ Р.С. Психология. Кн.3. – М., 1999.

4. ШМЕЛЕВ А.Г. и коллектив. Основы психодиагностики. – М.,1996.


ОЦЕНКИ ШКАЛЬНЫЕ — способ оценки результата теста путем установления его места на специальной шкале. Шкала содержит данные о внутригрупповых нормах выполнения данной методики в выборке стандартизации. Так, индивидуальные результаты выполнения заданий (оценки первичные испытуемых) сравниваются с данными в сопоставимой нормативной группе (напр., результат, до­стигнутый учеником, сравнивается с по­казателями детей того же возраста или года обучения; результат исследования общих способностей взрослого сопостав­ляется со статистически обработанными показателями репрезентативной выборки лиц в заданных возрастных пределах).

О. ш. в этом смысле имеют четко определенное количественное содержание и могут быть использованы при статистическом анализе. Одной из распространен­ных в психологической диагностике форм оценки результата теста путем соотне­сения с групповыми данными является расчет процентилей. Процентиль — процентная доля индивидов из выборки стандартизации, результат которых ниже данного первичного показателя. Шкалу процентилей можно рассматривать как совокупность ранговых градаций (см. Корреляция ранговая) при 4числе рангов 100 и отсчете от 1-го ранга, соответствующего самому низкому результату; 50-й процентиль 50) соответствует медиане (см. Меры центральной тенденции) распределения результатов, Р>50 и Р<50 соответственно представляют ранги результатов выше и ниже среднего уровня результата.

Процентили не следует смешивать с обычными процентными показателями. Последние представляют собой долю правильных решений из общего количества заданий теста в индивидуальном результате (см. Оценки первичные). Ранги Р1 и Р100 получают соответственно самый низкий и самый высокий результаты из наблюдавшихся в выборке, однако этим рангам могут соответствовать и далеко не ну­левой (ни одного правильного решения) или абсолютный (все решения правильны) показатели (например, при общем количестве 120 заданий минимальный ре­зультат, соответствующий первому ран­гу, может составить 6 правильных реше­ний, в то время как максимальный резуль­тат, соответствующий рангу Р100 будет составлять 95 правильно решенных зада­ний). Такая ситуация наблюдается, напр., при оценке тестов скорости.

Основной недостаток процентильных шкал состоит в неравномерности единиц измерения. При нормальном распределе­нии отдельные переменные тесно группи­руются в центре распределения и по мере удаления к краям рассеиваются. Поэтому равным частотам случаев вблизи центра соответствуют более короткие интервалы по оси абсцисс, расположенные по краям распределения оценок. Процентили пока­зывают относительное положение каждо­го испытуемого в нормальной выборке, но не величину различий между результатами. Это создает некоторые неудобства в интерпретации индивидуальных резуль­татов. Так, разница в первичных пока­зателях, соответствующая интервалу Р70 - Р80 может составить 10 баллов, а различие в количестве правильных реше­ний в интервале рангов Р50Р60 — лишь 1-3 балла.

Вместе с тем процентильные оценки обладают и рядом достоинств. Они легко доступны пониманию пользователей пси­ходиагностической информацией, универ­сальны по отношению к различным типам методик и легко рассчитываются.

Процентильные оценки не относятся к типичным шкальным показателям. Более широкое распространение в психодиагностике получили стандартные показатели, рассчитываемые на основе линейного и нелинейного преобразования первич­ных показателей, распределенных по нормальному или близкому к нормальному закону. При таком расчете проводится z-преобразование оценок (см. Стандартизация, Нормальное распределение). Чтобы определить z-стандартный показатель, определяют разность между индивидуальным первичным результатом и средним значением для нормальной группы, а затем делят эту разность на σ нормативной выборки. Полученная таким образом шкала z (рис. 50) имеет среднюю точку М=0, отрицательные значения обозначают результаты ниже среднего и убывают по мере удаления от нулевой точки; положительные значения обозначают соответственно результаты выше среднего. Единица измерения (масштаб) в шкале z равна 1 σ стандартного (единичного) нормального распределения.

Для преобразования полученного при стандартизации распределения первичных нормативных результатов в стандартную z-шкалу необходимо исследовать вопрос о характере эмпирического распределения и степени его согласованности с нормальным (см. Оценка типа рас­пределения}.

Поскольку для большинства случаев значения показателей в распределении умещаются в пределах М ± 3σ, единицы измерения простой z-шкалы слишком велики. Для удобства оценивания применяется еще одно преобразование типа = ——. Примером такой шкалы могут быть оценки тестовой батареи SAT (СЕЕВ) методики для оценки способнос­ти к обучению (см. Тесты достижений}. Эта z-шкала пересчитана таким образом, что средней точке соответствует значение 500, а σ = 100 (рис. 50). Другим аналогичным примером является шкала Векслера для отдельных субтестов (см. Векcлера интеллекта измерения шкала, где М=10, σ=3.

Наряду с определением места индивидуального результата в стандартном распределении групповых данных введение О. ш. направлено и на достижение другой важнейшей цели — обеспечение сопоставимости количественных результатов раз­личных тестов, выраженных в стандарт­ных шкалах, возможности их совместных интерпретаций, сведение оценок к единой системе.

В случае, если оба распределения оце­нок в сравниваемых методиках близки к нормальному, вопрос о сопоставимости оценок решается довольно просто (в лю­бом нормальном распределении интервалам М±nσ соответствует одинаковая частота случаев). Для обеспечения сопоста­вимости результатов, принадлежащих к распределениям другой формы, применяются нелинейные преобразования, позво­ляющие придать распределению форму заданной теоретической кривой. В качестве такой кривой обычно используется нормальное распределение. Как и в простом 2-преобразовании, нормализованным стандартным показателям можно придать лю­бую желаемую форму. К примеру, умножив такой нормализованный стандартный показатель на 10 и прибавив константу 50, получаем Т-показатель (см. Стандартизация, Миннесотский многоаспект­ный личностный опросник).

Примером нелинейно преобразованной в стандартную шкалу является и шкала станайнов (англ. standart ten — стан­дартная деcятка), где оценки принимают значения от 1 до 9, М=5, σ=2.

Шкала станайнов получает все большее распространение, сочетая в себе достоинства стандартных шкальных показа­телей и простоту процентилей. Первич­ные показатели легко преобразуются в станайны. Для этого испытуемых ранжи­руют по возрастанию результатов и из них образуют группы с числом лиц, пропорциональным определенным часто­там оценок в нормальном распределении тестовых результатов (табл. 19). При трансформации оценок в шкалу стенов (от англ. standart ten — стандартная десятка) проводится аналогичная процедура с той лишь разницей, что в основании этой шкалы лежат десять стандартных интервалов.

Таблица 19

Перевод первичных тестовых результатов в шкалу станайнов

Процент обследованых в выборке стандартизации                  
Станайн                  

Пусть в выборке стандартизации 200 человек, тогда по 8 (4%) испытуемых, имеющих самые низкие и самые высокие оценки, будут отнесены к 1 и 9 станайнам соответственно. Процедура продолжается до заполнения всех интервалов шкалы. Соответствующие процентным градациям баллы по тесту, таким образом, будут упорядочены в шкалу, соответствующую стандартным частотам распределения результата.

Одной из наиболее распространенных форм О. ш. в тестах интеллекта является IQ-показатель стандартный (М=100, σ=16). Эти параметры для стандартной шкалы оценок в психодиагностике выбраны в качестве эталонных. Как видно из рис. 50, существует довольно много шкал, опирающихся на стандартизацию; их оценки легко сводимы друг к другу. Шкалирование в принципе допустимо и желательно для широкого круга методик, при­меняемых в диагностических и исследова­тельских целях, в том числе и для мето­дик, результаты которых выражены в качественных показателях. В этом случае для стандартизации можно использовать перевод номинативных шкал в ранговые (см. Шкалы измерительные) или разра­ботать дифференцированную систему ко­личественных первичных оценок.

Следует отметить, что при всей про­стоте, наглядности шкальные Показатели являются статистическими характеристиками, позволяющими лишь указать на место данного результата в выборке из множества аналогичных по характеру измерений. Шкальный показатель даже для традиционного психометрического инструмента является лишь одной из форм выражения показателей теста, используемых при интерпретации резуль­татов обследования. Количественный анализ при этом должен всегда прово­диться в комплексе с многосторонним качественным изучением причин возник­новения данного тестового результата с учетом как комплекса сведений о личности испытуемого, так и данных о текущих условиях обследования, надежности и валидности методики. Гипертрофированные представления о возможности обоснованных заключений лишь по количественным оценкам приводили к многим ошибочным представлениям в теории и практике психологической ди­агностики (см. Интеллекта коэффици­ент, Тесты интеллекта).



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-12-12 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: