Задача: оценка двух распределений и их различия. Влияние какого-то фактора.




Проверяем эти гипотезы с помощью сравнения средних.

 

Непараметрические критерии.

Выборка небольшого размера, может быть не нормальное распределение, перекошено влево или вправо.

 

Непараметрические в меню:

Анализ - Непараметрические – Одновыборочный: появляется цель, поля, параметры.

Например, Цель: Автоматически сравнить наблюдаемые с гипотетическими.

Есть другая задача – получили некоторую последовательность ответов испытуемого – оценить, что ответы не случайны?

Параметры: автоматически – СПСС сам думает что надо (как для обычного психолога). Если настроить, то можно самим.

Например, можем сравнить с нормальным: Колмогоров-Смирнов (там параметры, также указываем). Можем сравнить с гипотетической медианой.

Сравнение с биноминальным распределением - позже рассмотрим.

Запустили файл Стернбернг групповой (17.02). Получили ответы: нулевая принимается – что медиана не отличается, распределение не нормальное. Следовательно, будем применять непараметрический критерий.

ФОТО: Непараметрические критерии.

Пример:

Смотрим 15 испытуемых, предъявляем 10 слов последовательно в медленном и быстром темпе. Потом распознавание слов с быстрым или медленным темпом. По законам рабочей памяти у нас есть зависимость от времени предъявления (либо помним больше, либо забываем больше). Вопрос: отличается ли медленное от быстрого.

Смотрим распределение. Данные метрические – количественные данные, можем использовать либо Т критерий, либо непараметрический. Т критерий чувствителен к равенству дисперсий. Смотрим. Видим, что у них не равны дисперсии.

Есть среднее по компания и надо подобрать не хуже – подбираем статистически (сравниваем со средними). График: анализ, описательные, частоты, диаграммы (гистограммы + показать нормальное).

дисперсии).

 

Слово средние меняем на МЕДИАНУ (если данные порядковые, ранговые, номинальные – тут среднеарифметическое не является мерой среднего). Медианные критерии – критерии о сдвиге (одно в целом выше, чем другое).

 

Меню: Непараметрические, устаревшие диалоговые окна. Две несвязанные выборки. =>

Критерий Уилкоксона.

Получаем 0.551 – значимость. Нулевая гипотеза не отвергается.

 

Ряд других критериев проверяют более сложное:

Насколько они похожие (было всего 3 кто наверху, остальные были внизу).

Ранговые критерии ранжируют все в линию и смотрят, насколько первая выровнена, по отношению ко второй.

 

 

ВЗЯТЬ из файла Гусева.

…..

Если две независимые выборки:

ü Критерий Манна-Уитни: проверяет гипотезу о том, что две генеральные совокупности, из которых были отобраны выборки, эквивалентны по расположению.

Критерий Манна Уитни - улавливает меньшие различия. Работает на порядковых данных. Не может шкалу наименований.

ü Критерий Z Колмогорова-Смирнова и критерий серий Вальда-Вольфовица носят более общий характер и выявляют различия между распределениями, как в расположении (медиан), так и в их форме.

ü Критерий экстремальных реакций Мозеса предполагает, что экспериментальная переменная воздействует на некоторые объекты в одном направлении, а на другие объекты в противоположном. Критерий выявляет экстремальные отклики в экспериментальной группе в сравнении ее с контрольной группой.

Критерий Мозеса: учитывает выброс (было какое-то сильное воздействие, например, фармотерапия).

 

Несколько выборок:

ü Критерий Краскала-Уолеса: являются расширением критерия U Манна-Уитни, представляет собой непараметрический аналог однофакторного дисперсионного анализа и используется для выявления различий в расположении распределений выборок.

Краско Уолеса – аналог дисперсионного анализа.

ü Медианный критерий: является более общим, но не столь мощным критерием как Краскала-Уолеса, используется для выявления различий между распределениями и в расположении медиан, и в их форме.

ü Критерий Джонкхира-Терпсты: если есть упорядоченность значений НЗП (групп), то он самый мощный.

Критерий Джонхира-Терпсты. Сильный, но работает в ограниченных условиях: есть новички, профессионалы и эксперты. То есть группы упорядочены по какому-то признаку. Тогда группирующая переменная – переменная, измеренная по шкале порядка. Можно по стажу группировать. Группы отличаются по порядку: одна лучше другой, третья лучше второй.

 

Для связанных зависимых парных выборок.

· Критерий Улкоксона: если данные являются непрерывными. Учитывает информацию как о знаке разности между парами, так и о величине этой разности. Поскольку критерий знаковых рангов Уилкоксона использует больше информации о данных, он является более мощным, чем критерий знаков.

Критерий Уилкоксона. Предполагает что данные не хуже чем шкала порядка. Непрерывные (недихотомические – нолики и единички). Если слабая порядковая шкала, то не надо его использовать. ТО есть рангов 7,9,12, 15 можно попробовать использовать. Если этого нет, то критерий знаков.

· Критерий знаков: рассчитывает разности между двумя переменными для всех наблюдений и классифицирует их как положительные, отрицательные (разные) или совпадения (нулевые, одинаковые).

Критерий знаков – самый универсальный, работает при 3,5,7 ранговых оценок. Важно чтобы была шкала порядка. Смотри разницу: 2-2- разница 0. 1-2 разница «-1».

· Критерий Макнемара: е сли данные являются бинарными. Оценивает эффект влияния некоторого экспериментального фактора в планах «до - и - после».

Критерий Макнемара: Если данные бинарные, номинальные – сделал - не сделал (0 или 1).

· Критерий маргинальной однородности: е сли данные являются категориальными. Обобщает критерий Макнемара (только для двоичных – биноминальных измерений ЗП) на случай полиномиальных откликов.

Критерий маргинальной однородности. Это не только 0-1, а мультизначение.

 

Несколько выборок – больше чем 2

ü Критерий Фридмана: это непараметрический эквивалент одновыборочного плана с повторными измерениями. Для каждого наблюдения k переменных ранжируются от 1 до k. Статистика критерия основывается на этих рангах.

ü Критерий W Кендалла: Критерий W Кендалла интерпретируется как коэффициент конкордации (согласованности), который является показателем согласия среди респондентов (экспертов). Каждый наблюдение представляет эксперта, каждая переменная - оцениваемый объект. Для каждой переменной вычисляется сумма рангов. Значение W Кендалла изменяется от 0 (нет согласия) до 1 (полное согласие).

Критерий Кендалла используется, когда надо оценить экспертов (одна группа испытуемых и проанализировать насколько согласуются эксперты).

ü Критерий Q Кокрена: идентичен критерию Фридмана, но применяется для бинарных данных. Является развитием критерия Макнемара для k выборок. При помощи критерия Q Кокрена проверяют гипотезу о том, что несколько связанных дихотомических переменных имеют одинаковые средние значения.

Критерий Кокрена – работает с бинарными данными. Одна и та же группа оценивается несколько раз, они дают бинарные оценки: Да-нет, выбрал-не выбрал и т.д.

 

Практическая работа 17.02 файл.

Критерий Левиня говорит, что Стьюдент хорошо с равными дисперсиями. Смотрим, что значимость велика, значит схожи.

Шкала экзистенций файл.

STи P– не имеют нормальное распределение, поэтому применяем Манна-Уитни. Смотрим по Полу различия (группирующая переменная).

Значимость большая – различий нет статистически значимых.

Теперь несколько групп:

Гипотеза – возраст испытуемых влияет на шкалы экзистенций. Если это так, то какая-то группа будет отличаться. Метод дисперсионного анализа – несколько групп испытуемых.

 

Добавляем описательные статистки, делаем график.

Апостериорные тесты (как анализ будет, то посмотрим каждый с каждым): НЗР. Делает поправку на количество

В итоге посмотрели, по всему не показала, по парам также не показало.

 

Если бы были различия установлены, то увидели бы по парам. Факторный эффект получили, потом переходим сравнение средних по группам.

 

Меню: Анализ – непарметрические – устаревшие окна - >для К независимых.

 

Как записывать вывод:

Сравнивали группы по критерию Вилкоксона (это надо писать в методике, почему выбираем этот критерий, какой тест используем и т.д.).

Хи-квадрат = 0,094 (2), р=0,954. Сравнивали 3 группы, степень свободы = 2.

 

Пример, личность и сенсорные способности. Делали повторные сравнения в разных сериях эксперимента. Плюс измерили личность по опросникам Айзека. Если различия есть, то гипотеза подтверждается.

Сложность серии влияет на характеристику исполнения.

 

Все пары значимо отличаются. Получены статистически достоверные различия.

 

Файл – индивид и музыка.

Проверяем на критерии, но так как слабопорядковые данные, то надо брать медианный критерий. На всякий случай Краска Уолеса

 

Смотрим по рангу. Чем больше значение, тем больше не любят.

 

Далее будем смотреть –

общая линейная модель. ОЛМ-одномерная, многомерная (когда не одна зависимая переменная, а больше). Жестко параметрические модели, требуют нормального распределения, равенства дисперсий, но не очень чувствительны к этому.

Обобщенные линейные модели – взаимодействия и случайные факторы. Можно обрабатывать любые данные – и номинальные и мультиноминальные и порядковые и количественные.

 

 

ЛЕКЦИЯ 4 02.03.2016

Научились считать среднюю, две контрольные и экспериментальную. Делали с помощью параметрического и непараметрического подхода.

Параметрические – Т критерии Стьюдента, для парных независимых, одновыборочные Т критерии. И Непараметрические тесты.

Мы всегда проверяли гипотезу – есть ли влияние какого-то фактора на какую-то переменную. Если влияние какого-то фактора есть, значит, фактор влияет на зависимую переменную.

Если сравниваем 2,3,4 повторных измерения, то смотрим влияние во времени. Если различные, то есть влияние.

Когда сравнивали две выборки – то сравнение с помощью Т критерия, с помощью дисперсионного анализа, критерия Фишера сравнивали несколько распределений.

 

Когда мы делаем анализ, мы всегда должны помнить про группировку данных: переменная должна разбивать на группы (числа в этой переменной должны разбивать на группы). Принадлежность к группе – есть признак независимой переменной: возраст – несколько возрастных, по лояльности, по тревожности разделяем и т.д.

То есть ОДНА из колонок должна группировать переменную (1-2, 1-3 и т.д.).

 

Межгрупповом дизайне не можем использовать Т-критерий, дисперсионный анализ, если нет группирующей переменной.

Дизайн – это экспериментальный план (в основе межгрупповой, внутри групповой дизайне). Мы намеренно осознаем наши группы испытуемых. Главное что мы сравниваем разные группы. Различие этих групп мы считаем независимой переменной, что будет влиять на зависимые переменные.

 

Если дизайн нашего исследования (план, замысел, намеренное создание определенных групп испытуемых) – одна группа, мы сморим воздействие внутри, формируем внутри группы, измеряем в разное время. Сравнение повторных измерений надо для контроля воздействия некоторого фактора на одну и ту же группу испытуемых.

 

Третий вариант – когда мы контролируем и внутри групповой фактор и межгрупповой фактор. Независимая переменная или фактор – причина обуславливающая изменения зависимых переменных. Например, фактор пола – сравниваем две группы. Возраст – сравнение возрастных, образование – сравнение по образованию.

Можем взять одну группу и смотреть как изменяется переменная (обучать и т.д.0)

 

Смешенный дизайн – контролируется и межгрупповой фактор и внутри групповой (М и Ж изучаем до и после лечения: межгрупповой – ПОЛ, внутри групповой – этапы лечения. Зачем надо – потому что М и Ж по-разному реагируют на терапию).

Статистическая гипотеза – имеет ли место статистическое подтверждение. Что надо для этого сделать – например, есть ли фактор пола – сравнить по какой-то переменной две группы м и ж. Сравнить среднее, медианы, разброс. Посмотреть фактор влияния психотерапии – сравнить до и после и сравнить с контрольной группой (чтобы проверить что эффект реальный).

 

Каждому дизайну можно поставить соответствие необходимость применения статистических методов, которые сравнивают групповые средние, медианы, частоты.

 

Что мы проверяем в рамках смешенного эксперимента: хотим узнать влияет ли лечение на М и Ж, есть ли взаимодействие ДВУХ факторов – причины и пола.

 

Эффект межфакторного взаимодействия. Когда рассматриваем многофакторный эксперимент – влияние нескольких. Оцениваем влияние каждого и совместное.

Это нельзя обработать ни Т критерием, ни Вилкосона.

 

Делаем с помощью дисперсионного анализа, который позволяет оценить вклад каждого фактора и взаимодействие факторов в общей дисперсии. Так проверяются экспериментальные гипотезы.

 

Уровни фактора и уровни независимой переменной.

Это каким образом мы дифференцированно оцениваем влияние независимой переменной (пол – два уровня, возраст – три группы, образование – среднее, специальное, высшее – три уровня фактора).

 

Есть несколько уровней факторов на нескольких переменных – 2 на 3.

 

Итого: в однофакторном – влияние одного фактора, многофакторном – нескольких, но это не все. Мы должны сказать про влияние взаимодействие факторов.

Это в разделе результатов должны оценивать эти факторы.

 

Когда оцениваем влияние одного фактора – это ГЛАВНЫЙ эффект.

Совместное влияние нескольких – оцениваем вклад (влияние) межфакторного взаимодействия.

 

Когда многофакторный дисперсионный анализ.

Есть зависимая – время реакции, тревожность, интеллект и мы проверяем гипотезу, что на него влияет Факт А и Факт Б, пол и образование. И эффект их совместного влияния.

Мы проводим исследование с погрешностью (не поняли, делали не то и т.д.), сюда входят случайные факторы еще. Надо оценить вклад каждой компоненты.

При двухфакторной ДА рассчитывает как можно спрогнозировать реакцию испытуемого такого то пола, такого то возраста.

 

ДА – решение регрессионных уравнений. Попытка выявить насколько значим вклад каждого.

 

Когда имеем дело с повторными измерениями, то мы имеем большое преимущество – одна группа в разных условиях, мы не сталкиваемся с проблемой сравнения разных групп. Мы уходим от факторов межиндивидуальных различий. И есть параллельные формы тестов.

В случае одной группы мы можем из общей дисперсии вычесть вклад индивидуальных различий. Тогда дисперсионный анализ будет эффективней.

 

Когда критерий большой – когда большой числитель, а это тогда, когда есть отличие между группами (там оценка межгрупповых различий, дисперсии будут отличаться).

 

Например, психотерапия. Измерили до в процессе и после. Эффекта нет, если нет различия.

Приступаем к ЗАДАНИЯМ.

 

Личность и психофизика.

Эксперимент: смешанный дизайн, контролировался и межгруппой и внутригрупповой. Предполагалось, что люди с разными личностными ресурсами по разному будут решать задачи разной сложности. Легкая – личностные не включаются ресурсы, сложные – включаются. Должен обнаруживать сигнал – пикало на фоне шума то слева, то справа. Сигнал очень тихий. В других был пшш или пикание – надо было определить – шум или пикание. Была легкая, сложная, средняя. Делали в случайном порядке (рандомизировано).

Испытуемые до или после давали

Опросник Айзенка, уровень экстраверсии, невротизма (кто ниже 5 медиан интроверты, выше - экстраверты, ниже невротичные, выше – эмоционально стабильные – типичное разбиение по медиане).

Давали еще Опросник Роберта Таера – диспозицию оценить. Мерили уровень энергетической мотивации и напряжения (бодрый, активный, в противовес сонливым, замедленным), также уверенный в противовес напряженный.

Опросник Микробиана – мотивация на достижение или избегание.

 

Сколько у нас факторов и какие: фактор внутри групповой – серия, три уровня (легкая, средняя сложная – проходят три серии). В СППС каждая серия КОЛОНОКЙ – межгрупповые только так.

Пять межгрупповых факторов (экстраверт-интроверт, стабильный-невротичный, мотивация на достижение, активность и т.д.). Факторы двух уровневые – разбиты относительно медианы.

Писать в отчете: Микс дизайн 3,2,2,2,2,2.

 

Все данные метрической шкалы => можем применить дисперсионный анализ.

Группа методов – ОЛМ – общая линейная модель.

Зависимых переменных одна – время реакции. = > ОДНОМЕРНАЯ модель. Если хотим обработать несколько ЗАВИСИМЫХ то будем использовать ОНОВА или ОЛМ многомерную.

 

Если СМЕШАННЫЙ дизайн – то ОЛМ с ПОВТОРНЫМИ ИЗМЕРЕНИЯМИ.

 

Оцениваем факторный эффект и межфакторное взаимодействие в каждой серии на Время реакции (ВР).

Как только – в каждой из трех серий – СМЕШАННЫЙ дизайн, ОЛМ повторные измерения.

Имя внутригруппового (серии отучаются СЛОЖНОСТЬЮ, трудностью): СЛОЖНОСТЬ.

Оцениваем серии, оцениваем влияние фактора сложности. Чтобы ответить – влияет сложность или нет.

Уровни: 3. Можно добавлять еще – когда – утром, вечером и т.д.

Имя Измерения – ВР (Время реакции).

Можно было бы еще несколько зависимых, но тут мы мерили время реакции (можно было бы мерить процент правильных, альфа ритмы и т.д.).

В окне только специфицируем (задали сложность и ВР). Переходим в основное окно. Переносим ВР разных уровней.

ОЛМ – повторные измерения

внутригрупповые присваиваем каждому уровню нужный столбец сложность).

Межгрупповые факторы – ставим второй фактор, например, экстраверсия.

 

Вкладка

Модель: можем оценивать по разным факторам.

Если плохие данные – не нормально распределены, разные дисперсии, группа неравномерная (перекошенная группа) – дисперсия в одной подгруппе будет более надежная, в другой менее надежная.

Применяются корректирующие формулы. Сумму квадратов считают по разным типам.

Самый универсальный ТРЕТИЙ тип суммы квадратов.

Контрасты:

Например, первая, вторая, третья серии – чем больше сложность, тем больше время. Хотим посмотреть – будет линейная функция или нелинейная. Можем, оценив контрасты, посмотреть какую математическую тенденцию имеем – квадратичную, кубическую и т.д.

Можем сами формулу нарисовать.

 

Графики.

По оси Х сложность ставим (там три уровня). Экстраверсия по другой.

Можем график по сложности построить, экстраверты тогда в одну группу.

Если по экстравертам и интровертам, то усредняется значения по сериям.

Параметры.

Сделать таблички по средним, например. Показывает веса каждого фактора в общую дисперсию.

 

Сморим способ анализа – смотрим на экран.

Сверху интроверты, снизу экстраверты.

Интроверты медленнее, экстраверты в целом быстрее при любых сложностях. Прямые почти параллельные. Поэтому взаимодействие скорей отсутствует.

 

Собрал по средним интроверсии по сложности 3 на 2.

Говорит инфо о выровненности группы, дал описательные статистики (для диплома информацию), посчитал критерий Кокса

 

Есть табличка многомерные критерии.

Отличаются от критерия Фишера. Их тут 4. Первый самый строгий и мощный (Пиллаи). Когда данные хорошие все критерии одинаковые, когда плохие – считают по-разному.

Многомерные критерии позволяют проверить гипотезу о значимости внутри группового фактора: сложность на время. Сложность влияет.

 

Эффект межфактора взаимодействия – сложности и экстраверсии. Смотрим внутри процент влияния, сложность 80%.

 

Ошибка модели – все, что не объясняется факторами. Дисперсионный анализ раскладывает на влияние факторов, но что-то остается и это переносится в ошибки.

 

Как работают все процедуры.

ОЛМ одномерная.

Влияет ли экстраверсия в сложной серии.

Влияет ли экстраверсия и невротизм в сложной версии.

Y=AХ+B – это модель. В – свободный член.

Смотрим чему равен Р квадрат – значимость влияния – регрессионная модель.

 

Есть другой подход рассуждения –

 

Многомерный дисперсионный анализ. МОНОВА.

 

Это процедура, которая позволяет обрабатывать эксперименты с несколькими зависимыми переменными, которые разделяют один и тот же конструкт.

Например, хотим изучить сложный психологический конструкт. Например, мотивация достижений.

Есть методика ТАТ, Лабиринты Хикауза, Опросник Орлова. Можем оценить разными способами – оцениваем надежно. Как обрабатывать эксперимент, чтобы изучать, что влияет на мотивацию достижения.

Придумали модель, которая учитывает что все показатели однотипные, однородные и учитывает один конструкт – связанные коррелирующие показатели. Мы можем их обработаться скопом и ответить на вопрос.

 

Вопрос: все они зависят от каких-то фактов, все три показателя как один пул зависят от каких-то фактов?

Пример, задача оценить уровень активности мозга и влияние лекарства на биоэлектрическую активность мозга. Берем 32 показателя мозговой активности и обрабатываем методом MONOVA.

Смотрим файл MONOVA (2 марта).

Регистрировали три показателя – время реакции (скоростной показатель), стабильности (время реакции, оценка среднеквадратичного отклонения) и особой чувствительности. Обнаружение сложных пороговых сигналов на пределе возможностей – на фоне шума (400 проб), способность услышать слабый сигнал.

Чем больше человек правильно обнаруживает сигналы, тем выше показатель сенсорной чувствительности.

Либеральный критерий – при прочих равных жмет, а есть кто очень жестко жмет – явный сигнал.

Показатели обнаружения сигнала зависят от экстраверсии и невротизма в целом все.

Можем посчитать корреляцию и показать связь.

Влияет ли на все три показателя вместе две личностные диспозиции: экстраверсия и невротизм.

Смотрим распределение испытуемых по группам, описательные статистики – для результатов и описания данных.

Также как в ОНОВЕ с повторными измерениями, в дело вступают многомерные критерии. Только с помощью них можно оценить влияние.

Посмотрели – отдельные факторы влияют, комбинация нет (смотрели в многомерных След Пилая).

В таблице ниже будут показатели. Многомерные критерии отвечают за среднюю температуру, F критерий за каждый.

Отдельно на время реакции влияет экстраверсия. Невратизм тоже нет.

Получили, что когда объединяем все ТРИ показателя, получаем факторный эффект, за счет связности данных.

 

То есть мы пытаемся объяснить поведение человека ни одним показателем, а тремя.

 

Если мы возьмем показатели, которые не будут коррелировать (например, Время Реакции, концентрация тромбоцитов и тест Люшера).

Одномерные может и покажет что влияют, но в целом покажет что не влияет.

 

Дисперсионный анализ оценивает различия. В какой-то группе различия становится огромными и факторные критерии нивелируются.

 

Пример Иванны: 11 испытуемых по два ролика: с правдой и ложью.

 

 

ЛЕКЦИЯ 5 09.03.2016

 

Есть группа методов – общие линейные модели и обобщенные линейные модели – ОЛМ.

Задача: оценить факторные эффекты и эффекты межфакторного взаимодействия. Влияет ли какая независимая переменная и другие факторы на то, что мы измеряем.

Мы используем группу процедур, называемых ОЛМ.

Общая линейная модель – работает ТОЛЬКО с метрическими данными и решает задачи сравнения нескольких средних (больше 2) – ONOVA (однофакторный дисперсионный анализ). Также можем оценивать эффекты межгрупповых и внутри групповых, когда их два и три. Это процедуры многофакторного дисперсионного анализа. Когда оцениваем не только факторный эффект, но и эффект межфакторного взаимодействия.

ОЛМ (Общая Линейная модель) одномерная – межгрупповые.

ОЛМ повторные измерения – обрабатывает эксперименты с внутригрупповыми факторами (одна группа, несколько раз).

Можем еще оценить насколько силен вклад не только одного, но и совместного.

 

Когда ни одна зависимая, а несколько (измеряем несколько независимых) – используем MONOVA – ОЛМ многомерная.

 

Если НЕМЕТРИЧЕСКИЕ данные, то мы можем сравнивать несколько медиан выборок, есть аналоги дисперсионного анализа – непараметрические тесты для несколько независимых выборок и нескольких связанных выборок.

 

Появилась еще

ОБОЩЕННАЯ линейная модель. Она работает с НЕМЕТРИЧЕСКИМИ данными (по шкале наименований – бинарные) с мультиноминальными данными (несколько категория), данные, которые нормально не распределены. То есть работает с данными низкого уровня измерения.

Обобщенные уравнения оценки (работает с повторными измерениями).

Смешанные модели – данные имеют иерархическую структуру. Например, испытуемому важно, что он не просто учится в ВУЗЕ, а в каком ВУЗе, на каком факультете. Если анализируем деятельность сетевой структуры, где расположены, в каком регионе, в какой стране. Оценивать эти влияния. ВЛОЖЕННЫЕ МОДЕЛИ (один фактор главный, другие подчинённые).

 

Итого: можем оценивать факторные эффекты, эффекты межфакторного взаимодействия для межгрупповых схем внутри групповых схем планирования.

И ТРИ уровня измерения – номинальный, мультиноминальный и порядковый, а также иерархизированные.

 

Когда говорим, что используем классический дисперсионный анализ, то говорим, что ставим задачу разложения дисперсии данных, которую наблюдаем на группах либо группе испытуемых на несколько составляющих: стараемся выделить из общей дисперсии данных ту компоненту дисперсии, связанную с влиянием одного фактора, другого фактора, их взаимодействие.

Для дисперсионного анализа требуется, чтобы все данные были сгруппированы – группирующие переменные, те факторы, которые контролируем экспериментально (пол, возраст и т.д.).

 

Когда используем стратегию однофакторного или многофакторного дисперсионного анализа, то мы четко должны знать.

Однофакторный – контроль одной из независимых переменных

Многофакторный – контролируем больше чем одну переменную, оцениваем эффект их взаимодействия (могут более интересны совокупные влияния).

Оценка межфакторного взаимодействия – создаются несколько групп переменных и по каждой подгруппе оценивается средняя дисперсия, решается вопрос.

Разделение испытуемых на группы имеет вклад в общую дисперсию или нет.

Допущения ДА: это нормальное распределение, оцениваем однородность дисперсии по Ливиню, наблюдения должны быть независимы – измерения по одной группе испытуемых независимы от другой. Понятно, что независимость нарушается, когда у нас ПОВТОРНЫЕ измерения.

 

ДА устойчив при нормальности и равной вариативности. Если испытуемых много, то ок.

Есть два варианта оценки дисперсий:

· Внутригрупповая

· Межгрупповая.

Когда сравнивается R отношение, то мы оцениваем общую дисперсию с дисперсией какого-то фактора (числитель больше знаменателя, то критерий Фишера большой, вносит достаточный вклад)

 

После того как решили что ЕСТЬ ФАКТОРНЫЙ ЭФФЕКТ. Мы можем использовать тест

Парных сравнений, сравнивая одну группу со второй, чтобы понимать В ЧЕМ ЗАКЛЮЧАЕТСЯ этот эффект.

Чтобы оценить сколько вести каждый фактор эффект есть мы оцениваем вес (в числителе сума квадратов оцениваемого фактора, в знаменателя – сумма квадратов всех факторов). Смотрим Ф отношение.

 

Если одна группа, то можно учесть вклад индивидуальных различий – учесть его вклад в общую дисперсию и убрать.

Одна группа – всегда зависимы измерения (толковый – всегда делает быстрее, моторный – всегда быстрее). Уменьшая знаменатель (выкидываем из обще дисперсии), тем самым у нас вырастает F коэффициент.

MONOVA (ОЛМ многомерная) работает с несколькими зависимыми переменными. Плохо работает на маленьких выборках. Решает задачу – есть ли изменение в зависимости от влияния какого-то фактора, ни одной зависимой переменной, а целой группой связанных, коррелированных переменных. Например, мотивация достижений – михрабиана, орлова, хигаузена. То есть, измеряем мотивацию достижений 3 опросниками – одна переменная несколькими тестами. Хотим смотреть какой фактор влияет на мотивацию достижений.

Для MONOVA и ОЛМ с повторными измерениями есть ограничения, которые проверяются отдельными статистическими показателями.

Например, для МОНОВы СПСС строит матрицу ковариаций (дисперсионная ковариация). Эти коэффициенты должны быть симметричны. Следить за критериями. Знать и быть осторожными.

 

Пример, оценивается Два критерия

М-тест Бокса. Для каждого уровня факторов

Пол 2 возраст 3, национальность 4. Контролирует равны ли матрицы для каждого уровня зависимой переменной. И уровень значимости больше 0,05. Если больше – то предположение не выполняется.

СПСС рассчитывая процедуру оценивает тест Бартледа на сферичность. Когда используем МОНОВУ мы должны включать только те переменные, которые друг с другом связаны, коррелируют – тест Бартледа проверяют – значимо или не значимо для каждого уровня факторов коррелируют значения переменных.

Если оценки по Хиккаузу и Орлову коррелируют, то можем обрабатывать МОНОВой. А здесь смотрим что ЗНАЧИМО – уровень значимости МЕНЬШЕ 0,05.

 

Есть режим не только меню, но есть режим и работы командного файла.

Есть НЕПАРМЕТРИЧЕСКИЕ процедуры – РАНГОВЫЕ КРИТЕРИИ.

Ранги смотрят

Есть число К в знаменателе – число совпадающих наблюдений ранжированных в каждой группе. Чем больше группы похожи проранжированные, тем меньше вероятность, что критерий покажет различие.

В первой 3 человека, во второй 2.

Ранги по 10 бальной:

Первая – 6, 6, 7.

Вторая – 4, 3

Выше вторая по рангам. Сумма ниже рангов.

 

Есть несколько критериев мер группового дизайна. Для порядковых данных много критериев, для метрических мало.

 

Обобщенная линейная модель – обрабатывает ВСЕ данные, любые – порядковые, количественные, повторные измерения и т.д.

 

Задачи: межгрупповой дизайн, внутри группой дизайн и МОНОВА. Чтобы понимать выводы и понимать основные показатели в таблице.

 

Примеры. Папка – 17 февраля. Файл: Шкала экзистенций.

Возраст, пол и значения экзистенций.

Задача: Отличаются по некоторым шкалам женщины и мужчины разных возрастов.

Метод: Двухфакторный дисперсионный анализ

Меню: ОЛМ-одномерная.

Зависимая – Берем шкалу SD.

Фиксированный Пол (1 – М, 2 – Ж), возраст (три группы выделили).

Модель: сморим влияние пола, возраста и межфакторного взаимодействия. Три компоненты дисперсии.

Графики: по Х три возрастные группы и линиями пол.

Параметры: имеет значение построить таблицы по полу и возрасту средних значений и т.д.

Описательные статистики

Оценки размера эффекта (Этта в квадрате).

Критерий однородности (Ливиня) (посмотреть выполнение требований однородности дисперсий).

Апостериорные критерии: Можно посчитать различия между группами.

НЗР – не даёт поправку на количество групп, а

Бонферони – делает поправку на количество сравниваемых средних (3 сравнения, а бывают много и попадаются значимые сравнения, критерий делает поправку на множественность, не дает проявиться случайной значимости).

Ковариаторы – если есть непрерывная переменная (насколько человек считает что он достигает жизненных целей, сколько достигли – пишут, эта переменная, связанная с исполненностью можем включить как еще один член в регрессионное уравнение и оценить вклад – то есть это тоже ВКЛАД – не групповой, а непрерывный).

 

Мы все что сделали – выражается через скрипт (это можно запомнить).

Результаты.

1. Сводная модель – мужчины и женщины, сколько кого. Женщин больше в среднем количество одинаковое в возрасте.

2. Описательные статистики.

3. Критерий Левиня – дисперсия наших групп не отличается – значимость БОЛЬШЕ чем 0,05 = > ДОПУЩЕНИЕ дисперсионного анализа выполняется (наши данные на допустимость к обработке).

4. Основная таблица. Критерии межгрупповых эффектов. Оцениваемые фактор: пол, возрастная группа и компонент межфакторного взаимодействия.

Пол – не значим.

Возраст – не значим

Эффект – не значим.

Каков вес в дисперсионной модели - (частичная эта квадрат): 1,3%, 0,6%, 5,2%. Они не значимы, уровень значимости выше чем 0,05.

Вывод оформляется:

Эффект пола был не значим (F (степени свободы числителя и знаменателя: пол (2-1 = 1), испытуемых минус количество групп = 54) = 0,7уровень значимости)

Эффект пола был не значим (F(1;54)=0.7;0,406).

 

MONOVA

24 февраля папка. Файл MONOVA.

Хотим посмотреть, что все три показателя (время реакции, среднеквадратичной отклонение и d’) связаны – характеризуют как показатели характеризующие эффективность человека при решении задачи.

ОЛМ-многомерная.

ВСЕ зависимые переменные.

Фиксированные факторы два: экстраверсия и невротизм.

Модель берем ПОЛНУЮ. Оба фактора и эффект взаимодействия.

Апостериорные не заказываем, так как всего ДВЕ группы испытуемых.

Параметры: таблички со средними, оценка эффекта, критерий однородности.

 

Результат.

Так как это многомерная, то смотрим критерий М Бокса. Он меньше чем 0,05.

Оснований считать эти матрицы однородными – не выполняется, данные не очень хорошие для процедуры.

ПОЯСНИТЬ – почему меньше – плохо.

 

Экстраверсия с точки зрения многомерных критериев весит почти 22%, невротизм почти 26%.

Видим, что есть 4 критерия оценки многомерного воздействия.

Используем След Пиллая – самый мощный.

Оформление вывода:

Использовали процедуру MONOVA по оценке влияния фактора экстраверсии по трем независимым переменным, обнаружили значимый эффект (F(3)=6,99, p<0.0001).

Тем самым показали, что использовали процедуру, посчитали F критерий, у которого три степени свободы (две группы интровертов, две интровертов = > 4 -1 =3).

Критерий Ливиня показал, что уровень значимости меньше 0,05, это говорит о том, что наши дисперсии похожи.

Смотрим эффект фактора экстраверсии, невротизма и общего в разрезе каждой переменной.

 

 

Если надо обрабатывать НЕМЕТРИЧЕСКИЕ данные – ранговые или номинальные или мультиноминальные.

Есть два класса моделей (смотри меню Анализ - >).

· ->Обобщенная линейная модель

· ->Смешенная модель

Обрабатывают любые данные. Основываясь на логике F критерия, к критерию Фишера не имеют отношения вообще. Используется соответствующий критерий согласно типу данных.

 

Пункты меню те же. Но разница в другом.

Если отклик бинарный или порядковый (много дискрипторов), данные в штуках, то модель другая.

Сколько не сдал экзаменов за обучение – 3,4: и т.д.

 

Дисперсионный анализ – это линейная модель, вклады каждого фактора. Здесь тоже так делается. НО если данные не количественные и нельзя построить линейное уравнение, то вводится понятие

Функция связи – функция, которая это распределение преобразует в количественное распределение. То есть появились формулы, которые делают линейное и они в новых процедурах.

Например, порядковый отклик (смотрим в обобщенной линейно модели).

Отвечаем на ряд вопросов: какая переменная зависимая, Какие предикторы (



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-08-08 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: