Лекция 2. Понятийный аппарат психологических и педагогических измерений. Определения понятий: педагогический тест, тестирование, тестологические характеристики теста, предтестовые и тестовые задания, фасет, дистрактор и др.
ИЗМЕРЕНИЕ — операция для определения отношения одной (измеряемой) величины к другой однородной величине, которая берётся за единицу. Получившееся значение будет численным значением измеряемой величины. Наука, предметом изучения которой являются все аспекты измерений, называется МЕТРОЛОГИЕЙ.
ПЕДАГОГИЧЕСКОЕ ИЗМЕРЕНИЕ - процесс установления соответствия между оцениваемыми характеристиками обучаемых и точками эмпирической шкалы, в которой отношения между различными оценками характеристик выражены свойствами числового ряда.
ТЕСТИРОВАНИЕ - метод педагогической диагностики, с помощью которого выборка поведения, репрезентирующая предпосылки или результаты учебного процесса, должна максимально отвечать принципам сопоставимости, объективности, надежности и валидности измерений, должна пройти обработку и интерпретацию и быть готовой к использованию в педагогической практике.
ПЕДАГОГИЧЕСКИЙ ТЕСТ определяется как система заданий специфической формы и возрастающей трудности, которая позволяет качественно и эффективно измерить уровень и структуру подготовленности испытуемых.
Предтестовое задание называется ТЕСТОВЫМ, если апостериорные количественные оценки его характеристик удовлетворяют определенным критериям, нацеленным на проверку качества содержания, формы и на выявление системообразующих свойств заданий теста.
ТЕСТОВОЕ ЗАДАНИЕ - это составная единица теста, отвечающая требованиям к заданиям в тестовой форме и, кроме того, статистическим требованиям:
|
1) известной трудности;
2) дифференцирующей способности (достаточной вариации тестовых баллов);
3) положительной корреляции баллов задания с баллами по всему тесту, а также другим математико-статистическим требованиям.
Классификация задач и методов их решения при измерении
Задачи | Условия | Методы |
1. Выявление различий в уровне исследуемого признака | а) 2 выборки испытуемых | Q – критерий Розенбаума; U – критерий Манна-Уитни; ф* – критерий (угловое преобразование Фишера) |
6) 3 и более выборок испытуемых | S – критерий тенденций Джонкира; Н – критерий Крускала-Уоллиса | |
2. Оценка сдвига значений исследуемого признака | а) 2 замера на одной и той же выборке испытуемых | Т – критерий Вилкоксона; G – критерий знаков; ф* – критерий (угловое преобразование Фишера) |
б) 3 и более замеров на одной и той же выборке испытуемых | Xr 2 – критерий Фридмана; L – критерий тенденций Пейджа | |
3. Выявление различий в распределении признака | а) при сопоставлении эмпирического распределения с теоретическим | x2 – критерий Пирсона; l – критерий Колмогорова-Смирнова; m – биномиальный критерий |
б) при сопоставлении двух эмпирических распределений | x2 – критерий Пирсона; l – критерий Колмогорова-Смирнова; ф* – критерий (угловое преобразование Фишера) | |
4. Выявление степени согласованности изменений | а) двух признаков | rs – коэффициент ранговой корреляции Спирмена |
б) двух иерархий или профилей | rs – коэффициент ранговой корреляции Спирмена. | |
5. Анализ изменений признака под влиянием контролируемых условий | а) под влиянием одного фактора | S – критерий тенденций Джонкира; L – критерий тенденций Пейджа; однофакторный дисперсионный анализ Фишера |
б) под влиянием двух факторов одновременно | Двухфакторный дисперсионный анализ Фишера |
Глоссарий
|
№ п/п | Понятие | Определение |
Измерение | процедура, с помощью которой измеряемый объект сравнивается с некоторым эталоном и получает числовое выражение в определенном масштабе или шкале | |
Измерительные шкалы | метрические системы, моделирующие исследуемый феномен путем замены прямых обозначений изучаемых объектов некоторыми признаками, наличие или степень выраженности которых представлена и оценивается испытуемыми в виде числовых значений, графического изображения (фигуры, вертикальные или горизонтальные линии) или в вербальной форме (например, в виде суждений о степени выраженности признака) | |
Шкалирование | метод моделирования явлений с помощью числовых систем | |
Числовые системы | множество элементов с реализованными в нем отношениями, существующими между элементами (или свойствами) реальных объектов | |
Психометрия (психометрика) | область психологии, связанная с теорией и практикой измерения психических явлений; математизированная технология создания стандартизированных, измерительных психодиагностических методик | |
Дифференциальная психометрия (дифференциальная психометрика) | область психометрии, определяющая и обосновывающая требования к измерению индивидуально-психологических различий в психологической диагностике | |
Математическая теория измерений | раздел математической психологии, интенсивно развивающийся параллельно и в тесном взаимодействии с развитием процедур психологического измерения (психометрией) | |
Нольмерное шкалирование | построение психологической шкалы, имеющей единственное значение и нулевую размерность | |
Шкала | форма фиксации совокупности признаков изучаемого объекта с упорядочиванием их в определенную числовую систему | |
Признаки и переменные | измеряемые психологические явления | |
Порядковая шкала | шкала, классифицирующая признаки по принципу "больше – меньше" | |
Принудительное ранжирование | ранжирование, при котором количество рангов соответствует количеству ранжируемых субъектов или объектов (ценностей, качеств и т.п.) | |
Интервальная шкала | шкала, классифицирующая по принципу "больше на определенное количество единиц – меньше на определенное количество единиц" | |
Шкала равных отношений | шкала, классифицирующая объекты или субъектов пропорционально степени выраженности измеряемого свойства | |
Метод ранжирования | процедура измерения, когда все объекты представляются испытуемому одновременно, и он должен их упорядочить по величине измеряемого признака | |
Метод парных сравнений | процедура измерения, когда объекты предъявляются испытуемому попарно (число предъявлений равно числу сочетаний) и он оценивает сходства – различия между членами пар | |
Метод абсолютной оценки | процедура измерения, когда стимулы предъявляются испытуемому по одному объекту, и он дает оценку стимула в единицах предложенной шкалы | |
Метод выбора | процедура измерения, когда испытуемому предлагается несколько объектов (стимулов, высказываний и тд), из которых он должен выбрать те, которые соответствуют заданному критерию | |
Шкала графическая | форма фиксации данных по измерительным шкалам при помощи наглядного отображения развития признака в виде непрерывной линии или определенной фигуры | |
Числовая шкала | форма фиксации данных в измерительных шкалах посредством их числовых значений | |
Вербальная шкала | форма фиксации данных в измерительной шкале, опирающаяся на набор суждений о наличии или степени выраженности изучаемого признака | |
Чувствительность | способность организма запоминать и реагировать на воздействия среды, не имеющие непосредственного биологического значения, но вызывающие психологическую реакцию в форме ощущений | |
Органы чувств | телесные органы, специально предназначенные для восприятия, переработки и хранения информации | |
Нижний абсолютный порог чувствительности | минимальная сила раздражителя, вызывающая едва заметное ощущение | |
Верхний абсолютный порог чувствительности | максимальная сила раздражителя, при которой еще возникает адекватное действующему раздражителю ощущение | |
Порог различения (разностный порог) | минимальное различие между двумя раздражителями, вызывающее едва заметное различие ощущений | |
Оперативный порог различимости сигналов | величина различия между сигналами, при которой точность и скорость различения достигают максимума | |
Закон Бугера-Вебера | психофизический закон, выражающий постоянство отношения приращения величины раздражителя, породившего едва заметное изменение силы ощущения к его исходной величине | |
Основной психофизический закон | положение, гласящее о том, что интенсивность ощущения пропорциональна логарифму силы раздражителя (величины стимула) | |
Пороговая зона | такой диапазон интенсивности раздражителя, на границах которого испытуемый практически всегда начинает или перестает ощущать воздействие стимула | |
Латентный анализ (от лат latentis – скрытый, невидимый) | совокупность аналитико-статистических процедур выявления скрытых переменных (признаков), а также внутренней структуры связей между ними | |
Фактор | конструкт, операционально определяемый его факторными нагрузками | |
Факторный анализ | комплекс аналитических методов, позволяющих выявить скрытые (латентные) признаки, а также причины их возникновения и внутренние закономерности их взаимосвязи | |
Дисперсионный анализ | анализ изменчивости признака под влиянием каких-либо контролируемых переменных факторов | |
Регрессионный анализ (от лат regressio – движение назад) | область статистического анализа, изучающая зависимость изменений значений переменных от одной или нескольких переменных (факторов) | |
Линия регрессии | линия, соединяющая точки средних значений сгруппированных признаков-факторов (те тех признаков, влияние которых на переменную изучается) | |
Достоверность различия (сходства) | аналитико-статистическая процедура установления уровня значимости различий или сходства между выборками по изучаемым показателям (переменным) | |
Инструкция | руководство по выполнению заданий теста, предъявляемое испытуемому письменно, устно или с помощью компьютера и направленное на создание адекватной мотивации, установки субъекта на обследование | |
Адаптация теста | комплекс мероприятий, обеспечивающих адекватность теста в новых условиях его применения | |
Точность (надежность) измерения | качество, отражающее близость результата измерения к истинному значению измеряемой величины | |
Правильность измерения | качество, отражающее близость к нулю систематических погрешностей результатов измерения | |
Сходность измерения | качество, отражающее близость друг к другу результатов измерений, выполненных в одинаковых условиях | |
Воспроизводимость измерения | качество, отражающее близость друг к другу результатов измерений, выполненных в разных условиях | |
Критерий валидизации | признак, независимый от валидизируемого теста, хорошо (достаточно надежно, полно) отражающий меру изучаемого качества (свойства, процесса) | |
Распределение | закономерность встречаемости признака и разных его значений | |
Нормальное распределение | вид распределения переменных, характеризуемое тем, что крайние значения признака в нем ссылаются достаточно редко, а значения, близкие к средней величине – достаточно часто | |
Параметры распределения | числовые характеристики распределения, указывающие, где в "среднем" располагаются значения признака, насколько эти значения изменчивы и наблюдается ли преимущественное появление определенных значений признака | |
Меры изменчивости | статистические показатели вариации (разброса) признака (переменной) относительно среднего значения, степени индивидуальных отклонений от центральной тенденции распределения | |
Стандартизация (от англ standard – типовой, нормальный) | унификация, регламентация, приведение к единым нормативам процедуры и оценок теста | |
Оценки первичные ("сырые" баллы) | оценки, полученные испытуемым на начальном этапе обработки результатов тестовой методики | |
Профильные оценки | способ представления количественных результатов психодиагностической методики, при котором оценки по отдельным группам заданий, субтестам с помощью специальных приемов приводятся к соизмеримым единицам (единой шкале оценок) и отображаются на графике | |
Шкальные оценки | способ оценки результатов теста конкретным испытуемым путем установления его места на специальной шкале |
|