Стандартизация в психометрике. Стандартизация теста и шкалы.

Психологическое тестирование - исследование определенных психологических качеств и свойств личности путем использования психологических тестов.

Важнейшей методической задачей, определяемой целью и содержанием теста, является необходимость сравнивать между собой оценки, получаемые различными испытуемыми, при соблюдении постоянства самой процедуры тестирования.

Как правило, при конструировании теста подготавливают детальные указания и руководства для его проведения. Сюда относятся такие требования, как точность предоставления материалов, лимит времени, характеристики подачи инструкции, ее форма, даже интонация и жесты экспериментатора и т.д.

Максимально значим последний этап психологического тестирования — интерпретация данных. Выделим в этой связи понятие "стандартизация", которое рассматривается в двух планах. Первый, заключается в постоянстве основных экспериментальных процедур. Второй полностью относится к понятиям нормы. Основная статистическая концепция, с помощью которой в большинстве диагностических методик решается проблема нормы, базируется на кривой нормального распределения Гаусса. Она получается в некоторых случаях в результате обследований больших популяций.

Стандартизация теста проходит два этапа. Первый относится ко времени конструирования теста и непосредственно связан с характеристикой наполняющих тест задач. этот этап берет начало с работ А. Бинэ, впервые расположившего задачи в порядке возрастающей трудности. Процедура определения трудности задач, хотя и носила эмпирический характер, позволяла тем не менее повысить объективность испытаний. Такой принцип определения трудности задач, в основном, сохранил свою значимость и по настоящее время.

Классификация и выбор задач для включения их в тест всегда связаны с необходимостью соблюдать определенную пропорцию в степени трудности применяемых задач, так как трудность теста непосредственно зависит от трудности вопросов, которые в него входят.

Поэтому окончательная проверка трудности самого теста обеспечивается испытанием его на репрезентативной выборке, которая, как правило, имеет достаточно большой количественный объем до 2—4 тыс. испытуемых. Эта процедура позволяет расположить оценки, получаемые отдельными индивидами, по их уровню так, чтобы имелась группировка индивидуальных оценок около центра шкалы распределения и постепенное снижение ее в обе стороны, по мере приближения к крайним точкам. Практически кривая нормального распределения вполне удовлетворительно описывает результаты испытаний подобного рода. Однако это имеет место только в конце процесса конструирования теста, так как на начальных этапах его формирования, как правило, наблюдаются различного рода отклонения. Регулировка структуры и содержания теста продолжается до тех пор, пока распределение оценок испытуемых не приблизится к нормальному. Фактически это достигается подбором испытуемых с разным уровнем развития исследуемой функции. Тесты умышленно конструируются и специально модифицируются таким образом, чтобы получить среднюю оценку правильно выполненных заданий, равную примерно 50%. Только таким путем возможно достигнуть максимальной дифференцировки индивидуальных различий при применении того или иного теста.

Использование понятия нормы на этапе интерпретации результатов тестового обследования несколько отличается от этапа составления теста. Непосредственные результаты тестового испытания (сырые оценки) в этом случае используются редко. Материалом, дающим основание для заключений о результатах психологического тестирования, являются так называемые приведенные показатели. Прежде всего, они позволяют определить положение индивидуальной оценки на оси нормального распределения. приведенные показатели обеспечивают экспериментатора мерой сравнения результатов деятельности отдельных индивидов.

На практике используются три основные группы приведенных показателей:

- возрастные -Концепция умственного возраста, введенная в период реконструкции шкалы Бинэ—Симона, в стэнфордской редакции, соотносит успешность выполнения тестовых задач с хронологическим возрастом испытуемого. существенный недостаток понятия умств. возраст — его значительная изменчивость во времени.

-процентили (% испытуемых, выполнивших определенную часть теста). недостаток процентилей — это существенное неравенство единиц отсчета в том случае, когда анализируют крайние точки распределения. При использовании процептилей определяется только относительное положение индивидуальной оценки, но не величина различия между отдельными показателями.

-Стандартные показатели, среди которых различают линейные и нормализованные. Линейные показатели подразумевают обычную линейную трансформацию исходных показателей в показатели стандартного отклонения. Нормализованные показатели позволяют наиболее удовлетворительно получать приведенные показатели, когда исходные данные трансформируются с помощью таблиц в нормальное распределение. Единственным ограничением в употреблении нормализованных стандартных показателей и одновременно требованием к ним является необходимость выведения окончательных оценок на больших репрезентативных выборках. Отклонения от нормы с высоким уровнем статистической значимости в этих случаях объясняются недостатками самого теста, а не индивидуальными особенностями ответов отдельного индивида.

Понятие нормы включает в себя элементы специфичности. норма тесно связана с контрольной выборкой, являющейся совокупностью конкретных лиц и показателей, извлекаемой из исходной популяции. Следовательно, норма не есть абсолютный и универсальный фактор, поэтому в отдельных случаях возможны и даже необходимы специализированные нормы. Речь идет о стандартизации тестов на узкозаданных выборках, формирование которых преследует локальные цели. Тесты в этих случаях весьма специфичны и наиболее эффективны.

Стандартизация шкалы. В психометрике следует различать две формы стандартизации. Под стандартизацией теста понимают прежде всего стандартизацию самой процедуры проведения инструкций, бланков, способа регистрации, условий и т. п. Без стандартизации теста невозможно получить нормативное распределение тестовых баллов и, следовательно, тестовых норм.

Применение стандартных шкал позволяет использовать более грубые, приближенные способы проверки типа распределения тестовых баллов. Если, например, процентильная нормализация с переводом в стены и линейная нормализация с переводом в стены по формуле дают совпадающие целые значения стенов для каждого Y, то это означает, что распределение обладает нормальностью с точностью до «стандартной десятки».

Применение стандартных шкал необходимо для соотнесения результатов по разным тестам, для построения «диагностических профилей» по батарее тестов и тому подобных целей.

Введение понятия репрезентативности позволяет нам дать более строгое определение того, что такое стандартизация теста. О СТАНДАРТИЗАЦИИ ТЕСТА в строгом смысле можно говорить, когда задана полная таблица соответствия сырой шкалы и стандартной шкалы и содержание этой таблицы обосновано статистической структурой распределения тестовых баллов на выборке стандартизации.

Стандартизация в психометрике. Стандартизация теста и шкалы.

Поиск по сайту