Cредство анализа надстройки «Пакет анализа» MS Excel «Двухвыборочный t-тест с одинаковыми дисперсиями»




 

Это средство анализа служит проверки гипотезы о равенстве средних двух независимых нормально распределенных выборок с одинаковыми дисперсиями. Для проверки необходимо заполнить диалоговое окно, приведенное на рис.4.8, назначение всех полей очевидно. Результат работы представлен на следующем рисунке. Сравните полученные результаты, с результатами, полученными вручную.


 


 

Рис. 4.9


Рис. 4.8

 

Дисперсии выборок неравны;

В этом случае

(4.14)

где и - выборочные стандартные отклонения, а число степеней свободы определяется довольно сложным способом, на практике, как правило, оно вычисляется с помощью статистических пакетов или в явной форме или в неявной форме как, например, в Excel.

Cредство анализа надстройки «Пакет анализа» MS Excel «Двухвыборочный t-тест с различными дисперсиями»

 

Это средство анализа служит проверки гипотезы о равенстве средних двух независимых нормально распределенных выборок с различными дисперсиями. Для проверки необходимо заполнить диалоговое окно, приведенное на рис.4.10, назначение всех полей очевидно.

Рис.4.10

б) случай двух зависимых выборок

Вычисление значения осуществляется по формуле (4.11), которая в данном случае примет вид:

(4.15)

где — разности между соответствующими значениями переменной X и переменной У, а - среднее этих разностей;

вычисляется по следующей формуле:

(4.16)

Число степеней свободы k определяется по формуле . Рассмотрим пример использования t-критерия Стьюдента для связных и, очевидно, равных по численности выборок.

 

ПРИМЕР 5

. Изучался уровень влияния тренинга после приема традиционных лекарств на частоту сердечных сокращений (ЧСС) у группы пациентов, страдающих тахикордией. С этой целью в экспериментальной группе проводилось измерение ЧСС до и после сеанса тренинга. Требуется проверить эффективность этой методики.

Рис. 4.11

Решение

В столбце B (рис. 4.11) содержатся значения ЧСС после приема лекарств без тренинга, в столбце С ЧСС после приема лекарств после сеанса тренинга

Очевидно, что в данном примере применима методика для связных и, очевидно, равных по численности выборок. Вначале произведем расчет (ячейка D20):

Затем применим формулу (4.16), получим:

 

И, наконец, следует применить формулу (4.15). Получим:

 

Число степеней свободы: и с помощью встроенной функции находим =СТЬЮДРАСПОБР(2*D23;D22). При вычислении следует учесть, что в данной задаче следует рассматривать одностороннюю критическую область. Множитель равный 2 перед уровнем значимости добавлен в силу конструктивной особенности этой функции (см.лаб.раб.2) , откуда следует возможность принятия альтерна­тивной гипотезы (H1) о достоверном уменьшении ЧСС, т. е. делается вывод об эффективности экспериментального воздействия.

В терминах статистических гипотез полученный результат будет звучать так: на 5% уров­не гипотеза Н0 отклоняется и принимается гипотеза Н1.

Cредство анализа надстройки «Пакет анализа» MS Excel «Парный двухвыборочный t-тест для средних»

Это средство анализа служит проверки гипотезы о равенстве средних парных наблюдений, когда наблюдения собранны в пары, и нужно исследовать разницу между ними. Для проверки необходимо заполнить диалоговое окно, приведенное на рис.4.12., назначение всех полей очевидно. Результат работы представлен на следующем рисунке (рис.4.13). Сравните полученные результаты, с результатами, полученными вручную.


 

Рис. 4.12


 

 

Рис. 4.13


ЗАДАНИЕ.

Задача 1

Изучается распределение непрерывного признака Х на объектах генеральной совокупности. С этой целью из генеральной совокупности извлечена выборка объема n. Все варианты и исходные данные взять из лаб. раб.3, предполагается, что все необходимые характеристики в указанной работе уже вычислены.

Требуется:

Проверить гипотезу о нормальности экспериментального распределения.

Решение

задачи 1 приведено выше.

Задача 2

Текст задачи в зависимости от варианта приведен ниже.

Пример задачи 2

В рабочей книге MS Excel Лечебницы.xls содержится случайная выборка данных о лечебницах, собранная Отделом здравоохранения штата Нью-Мексико. Ее фрагмент приведен на рис. 4.14

Рис. 4.14

Требуется:

Выяснить, есть ли разница между доходами городских и загородных лечебниц.

Решение

Выдвигаем гипотезу H0: средние значения доходов городских и загородных лечебниц выборок равны, альтернативная гипотеза H1: они не равны.

Чтобы проверить эту гипотезу по t-критерию необходимо выполнить ряд операций:

1. разделить выборку на две части: одна часть для городских, другая часть для загородных лечебниц, в дальнейшем считать эти части самостоятельными выборками;

2. выяснить, имеют ли эти выборки одинаковую дисперсию, если да, то перейти к пункту 3, иначе к пункту 4;

3. применить двухвыборочный t-тест с одинаковыми дисперсиями;

4. применить двухвыборочный t-тест с различными дисперсиями.

 

1. Для деления выборки воспользоваться Данные Сортировка. Результат приведен на рис. 4.15. Все данные расположенные в интервале строк 59:76 будем считать, что это элементы первой выборки, а данные в интервале строк 77:110 - это элементы второй выборки.

Рис. 4.15

 

2. Для проверки ли эти выборки одинаковую дисперсию, воспользуемся критерием Фишера.

Выдвигаем гипотезу H0, что дисперсии выборок равны, альтернативная гипотеза H1 - они не равны.

Воспользуемся надстройкой MS Excel «Пакет анализа» «Двухвыборочный F-тест для дисперсии», результат приведен на рис. 4.16

 

Рис. 4.16

Поскольку (вычисленное значение критерия не больше критического), то принимается гипотеза H0 (дисперсии равны), Отсюда следует, что можно применить двухвыборочный t-тест с одинаковыми дисперсиями.

Выдвигаем гипотезу H0: средние значения выборок равны, альтернативная гипотеза H1: они не равны. Воспользуемся надстройкой MS Excel «Пакет анализа» «Двухвыборочный t-тест с одинаковыми дисперсиями», результат приведен на рис. 4.16

Рис. 4.17

В качестве следует рассматривать двухстороннее значение. Анализируя величины и , получаем , следовательно гипотеза H0 отклоняется, H1 - принимается. Из этого следует вывод о том, что средние значения доходов городских и загородных лечебниц различны.

Задача 2

Вариант 1

В рабочей книге MS Excel Лечебницы.xls содержится случайная выборка данных о лечебницах, собранная Отделом здравоохранения штата Нью-Мексико.

Определите, есть ли статистически значимая разница между размерами (выраженная в количестве коек) загородных и городских.

Вариант 2

В рабочей книге MS Excel Лечебницы.xls содержится случайная выборка данных о лечебницах, собранная Отделом здравоохранения штата Нью-Мексико.

Верно ли, что загородные лечебницы используются реже, чем городские (с учетом разницы в размерах лечебницы).

Указание. В качестве характеристики использования лечебницы ввести переменную «Дней_на_койку», равную отношению количеству «Лечебные дни» к значению «Койки» для загородных и городских лечебниц.

Вариант 3

В рабочей книге MS Excel Лечебницы.xls содержится случайная выборка данных о лечебницах, собранная Отделом здравоохранения штата Нью-Мексико.

Верно ли, что загородные лечебницы имеют более низкий объем заработной платы, чем городские.

Вариант 4

В рабочей книге MS Excel Лечебницы.xls содержится случайная выборка данных о лечебницах, собранная Отделом здравоохранения штата Нью-Мексико.

Верно ли, что объем расходов в загородных лечебницах ниже, чем в городских (с учетом разницы в размерах лечебницы)?

Указание. В качестве характеристики объем расходов с учетом разницы в размерах лечебницы ввести переменную «Расход_на_койку», равную отношению количеству «Расходы» к значению «Койки» для загородных и городских лечебниц.

Вариант 5

В рабочей книге MS Excel ПреподКолледж.xls содержатся данных о заработной плате преподавателей колледжа. Верно ли, что утверждение, что преподаватели–женщины получают в среднем меньшую зарплату по сравнению с преподавателями-мужчинами?

Вариант 6

В рабочей книге MS Excel ПреподКолледж.xls содержатся данных о заработной плате преподавателей колледжа. Верно ли, что утверждение, что преподаватели со степенью при поступлении на работу получают в среднем большую зарплату по сравнению с преподавателями без степени при поступлении на работу?

Вариант 7

В рабочей книге MS Excel ПреподКолледж.xls содержатся данные о заработной плате преподавателей колледжа. Верно ли, что утверждение, что преподаватели со степенью при поступлении на работу имеют в среднем больший возраст по сравнению с преподавателями без степени при поступлении на работу?

Вариант 8

Рабочая книга MS Excel ПреподЗатраты.xls содержит данные о заработной плате учителей, затратах в общественных школах в пересчете на одного ученика. Верно ли, что утверждение, что в среднем зарплата учителя в северных районах отличается от в среднем зарплаты учителя в остальных районах?

Вариант 9

Рабочая книга MS Excel ПреподЗатраты.xls содержит данные о заработной плате учителей, затратах в общественных школах в пересчете на одного ученика. Верно ли, что утверждение, что в среднем затраты в общественных школах в пересчете на одного ученика в южных районах отличается в среднем от затрат в остальных районах?

Вариант 10

Рабочая книга MS Excel ПреподЗатраты.xls содержит данные о заработной плате учителей, затратах в общественных школах в пересчете на одного ученика. Верно ли, что утверждение, что в среднем зарплата учителя в западных районах отличается от в среднем зарплаты учителя в остальных районах?

Вариант 11

Рабочая книга MS Excel ПреподЗатраты.xls содержит данные о заработной плате учителей, затратах в общественных школах в пересчете на одного ученика. Верно ли, что утверждение, что в среднем затраты в общественных школах в пересчете на одного ученика в западных районах отличается в среднем от затрат в остальных районах?

Вариант 12

В 1970 году распределение спортсменов среди спортивных команд (драфт) было организовано с помощью лотереи: 366 возможных дат рождения спортсменов были помещены во вращающийся барабан и выбраны случайным образом последовательно одна за другой. Первая выбранная дата получила номер 1, вторая – 2 и т.д. В рабочей книге MS Excel Драфт.xls содержатся данные о полученных таким образом номерах драфта. Верно ли, что утверждение, что, спортсмены, родившиеся во второй половине года в среднем имеют более низкие значения драфта чем спортсмены, родившиеся в первой половине года?

Вариант 13

В 1970 году распределение спортсменов среди спортивных команд (драфт) было организовано с помощью лотереи: 366 возможных дат рождения спортсменов были помещены во вращающийся барабан и выбраны случайным образом последовательно одна за другой. Первая выбранная дата получила номер 1, вторая – 2 и т.д. В рабочей книге MS Excel Драфт.xls содержатся данные о полученных таким образом номерах драфта. Верно ли, что утверждение, что, спортсмены, родившиеся во второй половине месяца в среднем имеют более низкие значения драфта чем спортсмены, родившиеся в первой половине месяца?

Вариант 14

Рабочая книга MS Excel Кредиты.xls содержит данные об отказах в выдаче кредита для 20 кредитных учреждений в зависимости от расы и уровня дохода. Предполагается, что кредитные учреждения гораздо чаще отказывают представителям национальных меньшинств. Проверьте обоснованность этого утверждения.

Вариант 15

Рабочая книга MS Excel Кредиты.xls содержит данные об отказах в выдаче кредита для 20 кредитных учреждений в зависимости от расы и уровня дохода. Предполагается, что кредитные учреждения гораздо реже отказывают клиентам с высоким уровнем доходов. Проверьте обоснованность этого утверждения.

 

Вариант 16

Рабочая книга MS Excel Кредиты.xls содержит данные об отказах в выдаче кредита для 20 кредитных учреждений в зависимости от расы и уровня дохода. Есть ли основание предполагать, что для представителей национальных меньшинств с большими доходами не существует дискриминации?

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-04-11 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: