Надежность – согласованность показателей, полученных у тех же самых испытуемых при повторном тестировании тем же самым тестом или эквивалентной его формой. Надежный тест – тест, с помощью которого получаются одни и те же показатели для каждого обследуемого при повторном тестировании.
Виды надёжности
1 классификация [36].
Надежность целого теста
1. Надежность – устойчивость (ретестовая надежность). Измеряется с помощью повторного проведения теста на той же выборке испытуемых, обычно через две недели после первого тестирования.
Для интервальных шкал подсчитывается коэффициент корреляции произведения моментов Пирсона (r12). Для шкал порядка в качестве меры устойчивости к перетестированию используется коэффициент ранговой корреляции Спирмена.
2. Надежность – согласованность (одномоментная надежность). Простейший способ ее определения – коррелирование параллельных форм теста. Чаще всего параллельную форму теста получают расщеплением составного теста на “четную” и “нечетную” половины.
По каждой половине рассчитываются суммарные баллы и между двумя рядами баллов по испытуемым определяются допустимые коэффициенты корреляции. Получают коэффициент, относящийся к половинам теста. Для определения надёжности целого теста используют формулу Спирмена-Брауна.
Надежность отдельных пунктов теста
Чтобы повысить ретестовую надежность теста в целом, надо отобрать из исходного набора пунктов такие, на которые испытуемые дают устойчивые ответы.
Для повышения одномоментной надежности следует отбросить те пункты, которые плохо согласованы с остальными. В качестве меры корреляции вычисляется фи-коэффициент, значимость которого определяется с помощью критерия хи – квадрат. Если φ – коэффициент незначимый, то этот пункт исключается из теста. Можно использовать также точечно - биссериальный коэффициент корреляции.
|
2 классификация [44].
Надежность ретестовая – предполагает повторное предъявление того же самого теста тем же испытуемым и примерно в тех же условиях, что и первоначальное, а затем установление корреляции между двумя рядами данных. Интервал – не менее двух месяцев. Используется коэффициент корреляции произведения моментов Пирсона.
Надежность параллельных форм – предусматривает создание эквивалентных форм опросника и предъявление их одним и тем же испытуемым для того, чтобы затем оценить корреляцию между полученными результатами.
Надежность частей теста – определяется путем деления опросника на 2 части (обычно на четные и нечетные задания), после чего и рассчитывается корреляция между этими частями по формуле Спирмена –Брауна.
Валидность теста.
Валидность – степень, в которой тест действительно измеряет то, для чего он предназначен.
Надежность является необходимым, но не достаточным условием валидности.
Виды валидности [36, 44, 45]
1. Содержательная валидность – оценка теста производится за счет экспертов (устанавливающих соответствие заданий теста содержанию предмета измерения). Например, учитель может выступить в роли эксперта.
2. Эмпирическая валидность измеряется с помощью статистического коррелирования: подсчитывается корреляция двух рядов значений – баллов по тесту и показателей по внешнему параметру, избранному в качестве критерия валидности.
|
· Валидность “по одновременности ”, или текущая валидность. С помощью внешнего критерия. Информация собирается одновременно с экспериментами по данной методике (например, успеваемость в период испытания, производительность).
· Прогностическая валидность. Определяется по внешнему критерию. Информация по нему собирается некоторое время спустя. Например, способность к деятельности.
· Ретроспективная валидность. Определяется на основе критерия, отражающего события или состояния качества в прошлом. Например, прошлые оценки, прошлые экспертные заключения.
· Дифференциальная валидность. Например, тесты интересов коррелируются с академической успеваемостью, но в зависимости от дисциплины.
3. Конструктная валидность. (Конкурентная валидность).
Вычисляется, если для измеряемого свойства можно найти в литературе уже апробированный тест с известной валидностью. (Оценивается по корреляции разработанного теста с другими, валидность которых относительно измеряемого параметра установлена.)
4. Очевидная валидность – описывает представление о тесте, сложившееся у испытуемого. Тест должен восприниматься обследуемым как серьезный инструмент познания его личности.
Не существует какого-либо единичного показателя, с помощью которого устанавливается валидность психологического теста. Нельзя осуществить точные статистические расчеты, подтверждающие валидность методики.