Определение надежности тестов.

Надежность – согласованность показателей, полученных у тех же самых испытуемых при повторном тестировании тем же самым тестом или эквивалентной его формой. Надежный тест – тест, с помощью которого получаются одни и те же показатели для каждого обследуемого при повторном тестировании.

Виды надёжности

1 классификация [36].

Надежность целого теста

1. Надежность – устойчивость (ретестовая надежность). Измеряется с помощью повторного проведения теста на той же выборке испытуемых, обычно через две недели после первого тестирования.

Для интервальных шкал подсчитывается коэффициент корреляции произведения моментов Пирсона (r₁₂). Для шкал порядка в качестве меры устойчивости к перетестированию используется коэффициент ранговой корреляции Спирмена.

2. Надежность – согласованность (одномоментная надежность). Простейший способ ее определения – коррелирование параллельных форм теста. Чаще всего параллельную форму теста получают расщеплением составного теста на “четную” и “нечетную” половины.

По каждой половине рассчитываются суммарные баллы и между двумя рядами баллов по испытуемым определяются допустимые коэффициенты корреляции. Получают коэффициент, относящийся к половинам теста. Для определения надёжности целого теста используют формулу Спирмена-Брауна.

Надежность отдельных пунктов теста

Чтобы повысить ретестовую надежность теста в целом, надо отобрать из исходного набора пунктов такие, на которые испытуемые дают устойчивые ответы.

Для повышения одномоментной надежности следует отбросить те пункты, которые плохо согласованы с остальными. В качестве меры корреляции вычисляется фи-коэффициент, значимость которого определяется с помощью критерия хи – квадрат. Если φ – коэффициент незначимый, то этот пункт исключается из теста. Можно использовать также точечно - биссериальный коэффициент корреляции.

2 классификация [44].

Надежность ретестовая – предполагает повторное предъявление того же самого теста тем же испытуемым и примерно в тех же условиях, что и первоначальное, а затем установление корреляции между двумя рядами данных. Интервал – не менее двух месяцев. Используется коэффициент корреляции произведения моментов Пирсона.

Надежность параллельных форм – предусматривает создание эквивалентных форм опросника и предъявление их одним и тем же испытуемым для того, чтобы затем оценить корреляцию между полученными результатами.

Надежность частей теста – определяется путем деления опросника на 2 части (обычно на четные и нечетные задания), после чего и рассчитывается корреляция между этими частями по формуле Спирмена –Брауна.

Валидность теста.

Валидность – степень, в которой тест действительно измеряет то, для чего он предназначен.

Надежность является необходимым, но не достаточным условием валидности.

Виды валидности [36, 44, 45]

1. Содержательная валидность – оценка теста производится за счет экспертов (устанавливающих соответствие заданий теста содержанию предмета измерения). Например, учитель может выступить в роли эксперта.

2. Эмпирическая валидность измеряется с помощью статистического коррелирования: подсчитывается корреляция двух рядов значений – баллов по тесту и показателей по внешнему параметру, избранному в качестве критерия валидности.

· Валидность “по одновременности ”, или текущая валидность. С помощью внешнего критерия. Информация собирается одновременно с экспериментами по данной методике (например, успеваемость в период испытания, производительность).

· Прогностическая валидность. Определяется по внешнему критерию. Информация по нему собирается некоторое время спустя. Например, способность к деятельности.

· Ретроспективная валидность. Определяется на основе критерия, отражающего события или состояния качества в прошлом. Например, прошлые оценки, прошлые экспертные заключения.

· Дифференциальная валидность. Например, тесты интересов коррелируются с академической успеваемостью, но в зависимости от дисциплины.

3. Конструктная валидность. (Конкурентная валидность).

Вычисляется, если для измеряемого свойства можно найти в литературе уже апробированный тест с известной валидностью. (Оценивается по корреляции разработанного теста с другими, валидность которых относительно измеряемого параметра установлена.)

4. Очевидная валидность – описывает представление о тесте, сложившееся у испытуемого. Тест должен восприниматься обследуемым как серьезный инструмент познания его личности.

Не существует какого-либо единичного показателя, с помощью которого устанавливается валидность психологического теста. Нельзя осуществить точные статистические расчеты, подтверждающие валидность методики.

Определение надежности тестов.

Поиск по сайту