Достоверность выборочного коэффициента корреляции.




Достоверность разности коэффициентов корреляции определяется по обычной формуле

, где td — критерий достоверности разности коэффициентов корреляции;

d=r1-r2 —разность коэффициентов корреляции;

—ошибка разности, равная корню квадратному из суммы квадратов ошибок обоих сравниваемых коэффициентов корреляции; ;

tst — стандартные значения критерия Стьюдента;

 — число степеней свободы для разности коэффициентов корреляции, равное сумме чисел степеней свободы обоих коэффициентов: = n1–2 + n2–2=n1+ n2–4.

Билет 16.

1. Медиана значение признака, которое разделяет всю группу на две равные части: одна часть имеет значения признака меньшее, чем медиана, а другая — большее.

Для многочисленных групп медиану можно рассчитать по формуле

,где М е—медиана;

W α — начало того класса, в котором находится медиана;

k — величина классового промежутка;

n — общее число данных в группе;

—сумма частот классов (начиная с меньшего), предшествующих классу, в котором находится медиана;

f — частота класса, в котором находится медиана.

2.Ошибка коэффициента корреляции Как и всякая выборочная величина, коэффициент корреляции имеет свою ошибку репрезентативности, вычисляемую для больших выборок по формуле:

Где — коэффициент корреляции в генеральной совокупности, из которой взята выборка;

n — численность выборки, т. е. число пар значений, по которым вычислялся выборочный коэффициент корреляции.

Поскольку в числителе формулы ошибки выборочного коэффициента корреляции стоит квадрат генерального коэффициента корреляции, то эта формула может применяться лишь в исключительных случаях, когда заранее известна или предполагается степень корреляции в генеральной совокупности.

 

Билет 17.

1. Разнообразие значений признака. Всякая группа состоит из особей или объектов, отличающихся друг от друга по каждому из признаков. Различия эти иногда очень велики, иногда они почти незаметны, но они всегда имеются в группе, так как невозможно найти даже двух абсолютно одинаковых особей. Это второе основное свойство всякой группы — состоять из неодинаковых объектов по любому признаку — точнее всего определяется термином разнообразие (признака в группе).

--среднее квадратическое отклонение (сигма) -степень разнообразия особей в группе по изучаемому признаку;

--число степеней свободы равно числу элементов свободного разнообразия в группе;

--для быстрой и примерной оценки степени разнообразия часто применяются простейшие показатели: lim = { min ¸ max } — лимиты, т. е. наименьшее и наибольшее значения признака, p = (maxmin) —размах, или разность между лимитами;

-- проверка выпадов (артефактов) - такие записанные значения признака, которые резко отличаются от всех других значений признака в группе и др.

Коэффициент корреляции

Коэффициент корреляции измеряет степень и определяет направление прямолинейных связей.

Прямолинейная связь между признаками — это такая связь, при которой равномерным изменениям первого признака соответствуют равномерные (в среднем) изменения второго признака при незначительных и беспорядочных отклонениях от этой равномерности. Например, при увеличении длины тела на каждый сантиметр ширина увеличивается в среднем на 0,7 см. Основная формула, которая вскрывает сущность этого показателя, имеет совсем простую структуру:

, где r – коэффициент корреляции;

– нормированные отклонения дат по первому и второму признаку;

— число степеней свободы, равное в данном случае числу сравниваемых пар без одной. Максимальное значение коэффициента корреляции равно 1; для положительных, или прямых связей. Минимальное равно -1.

 

Билет № 18

1. Среднее квадратическое отклонение (сигма) Степень разнообразия особей в группе по изучаемому признаку измеряется несколькими показателями, из которых наибольшее значение имеет среднее квадратическое отклонение:

сигма в квадрате - дисперсия

2. Корреляция Во многих исследованиях требуется изучить несколько признаков в их взаимной связи. Если вести такое исследование по отношению к двум признакам, то можно заметить, что изменчивость одного признака находится в некотором соответствии с изменчивостью другого.В некоторых случаях такая зависимость проявляется настолько сильно, что при изменении первого признака на определенную величину всегда изменяется и второй признак на определенную величину, поэтому каждому значению первого признака всегда соответствует совершенно определенное, единственное значение второго признака. Такие связи называются функциональными.(прим: S треугольника определяется его высотой и основанием, длина окружности — радиусом и т.д) Живой организм развивается в связи с условиями его жизни, под действием бесконечно большого числа факторов, которые по-разному определяют развитие разных признаков.Такая связь называется корреляционной связью или просто корреляцией (напр: вес животных зависит от их длины) Корреляционная связь не является точной зависимостью одного признака от другого. Поэтому определяют форму, направление и степень корреляционных связей. По форме корреляция может быть прямолинейной и криволинейной, по направлению — прямой и обратной. Степень корреляции измеряется различными показателями, введенными для установления силы связи между количественными и качественными признаками. Такими показателями являются коэффициент корреляции r, корреляционное отношение η.

 

Билет № 19

1. Число степеней свободы Число степеней свободы равно числу элементов свободного разнообразия в группе. Оно равно числу всех имеющихся элементов изучения без числа ограничений разнообразия.

Например, для исследования требуется взять три объекта с любым развитием изучаемого признака. В данном случае величина признака не имеет никаких ограничений, поэтому число степеней свободы n=3–0=3.

Если требуется взять три числа с условием, что сумма их должна быть равна определенной величине, например: 100, то первое число может быть любой величины: 80, 800 и т. д., второе число также может быть выбрано свободно без всяких ограничений, например 10, 1269 и т. д., то третье же число может иметь только одно значение, такое, чтобы оно вместе с двумя предыдущими составило бы в сумме 100. два числа выбираются свободно, а третье не имеет свободы выбора: для трех чисел имеются две степени свободы n = 3—1=2.

2. Достоверность разности долей Достоверность разности выборочных долей определяется так же, как и для разности средних:

где td - критерии достоверности разности;

d=p1-p2 —разность выборочных долей;

—ошибка разности долей, равная корню квадратному из суммы квадратов ошибок сравниваемых долей.

Если требуется определить только достоверность разности, то квадраты ошибок долей определяются непосредственно:

; ;

 

Билет № 20

1. Коэффициент вариации Среднее квадратическое отклонение – величина именованная, выраженная в тех же единицах измерения, как и средняя арифметическая.

Поэтому для сравнения разных признаков, выраженных в разных единицах измерения, используется не абсолютное, а относительное значение среднего квадратического отклонения в форме коэффициента вариации(V):

2. Оценка генеральной доли Оценка генеральной доли, или определение ее доверительных границ, производится так же, как и оценка генеральной средней

Р = р ± дельта; А = t mp, где Р, р — генеральная и выборочная доли;

дельта = ts — возможная максимальная погрешность при. прогнозе генерального параметра (); t —критерий надежности (Стьюдент), mр — ошибка репрезентативности выборочной доли (показатель точности).

 

Билет №21

1. Лимиты и размах (lim и p) Для быстрой и примерной оценки степени разнообразия часто применяются простейшие показатели: lim = {min ¸ max} — лимиты, т. е. наименьшее и наибольшее значения признака, p = (max — min) —размах, или разность между лимитами. Для группы данных 1, 2, 3, 4, 5 лимиты и размах могут быть обозначены так: lim = l ¸ 5 В некоторых случаях лимиты могут служить единственной характеристикой признака.

2. Репрезентативность при изучении качественных признаков Качественные признаки обычно не могут иметь градаций проявления. Принципиальной разницы между количественными и качественными признаками нет. Степень проявлений большинства качественных признаков при более тщательном исследовании может быть измерена, и тогда качественный признак становится количественным. И, наоборот. Средняя величина ( для качеств признаков): ;где р — выборочная доля плюсовых объектов (имеющих изучаемый качественный признак); а — количество плюсовых объектов в группе; n — объем группы.

Ошибка репрезентативности доли аналогична ошибке средней и определяется по формуле

,

Билет №22

1. Приближенные значения μ и s Если не требуется особой точности, то на основе лимитов можно быстро определить приближенные значения средней арифметической и сигмы:

.

K- зависит от численности группы (n) (при n 2-5 K=2, 6-15 K=3 и.тд. >1000 K=7)

2. Определение достоверности разности средних Пример. Сравнивался вес взрослых индеек двух пород после одинакового откорма по двум выборкам. Получены следующие сводные показатели:

n1 = 20, μ1±s1 = 4,0 ± 0,3 кг;

n2 = 25, μ2±s2 = 4,6 ± 0,4 кг.

Вторая порода в выборке показала больший вес: d2-1 = μ2 — μ1 = 4,6 - 4,0 = + 0,6.

Определение достоверности этой разности проведено следующим образом:

d=0.6; () (t – достоверность)

v=20+25-2=43;

tst={2.0—2.7—3.5}.

Выводы.

1. Полученные результаты (d2-1 = + 0,6) свидетельствуют, что в некоторых группах вторая порода может оказаться в среднем тяжелее первой.

2. Так как полученная разность оказалась недостоверной (меньше Стьюдента), то ничего нельзя заключить о всех представителях обеих пород; осталось невыясненным, какая порода (вся) может иметь больший средний вес; нельзя считать доказанным, что разницы в среднем весе между породами нет и что эти породы в среднем одинаковы по весу.

 

Билет №23

1. Нормированное отклонение Обычно степень развития признака определяется путем его измерения и выражается определенным именованным числом: 3 кг веса, 15 см длины, 20 зацепок на крыле у пчел, и т.д. Этот основной способ характеристики признаков оказывается недостаточным, когда требуется еще и оценить полученное значение, т. е. определить, можно ли его считать значительным или, наоборот, недостаточным, или находящимся в норме.

Примен. показатель — нормированнныое отклонение : Нормированное отклонение показывает, на сколько сигм отклоняется значение признака от средней для соответствующей группы.

2. Критерий достоверности разности Достоверность выборочной разности измеряется особым показателем, который можно назвать критерием достоверности разности.

Критерий достоверности разности равен отношению выборочной разности к ее ошибке репрезентативности и определяется по формуле:

В этой формуле — разность выборочных средних, —ошибка выборочной разности, s1, s2 — ошибки репрезентативности сравниваемых выборочных показателей, tst — стандартное значение критерия, определяемое по таблице критериев —число степеней свободы для разности двух средних.

Если td>tst —разность достоверна с определенной надежностью. Если td<tst— разность недостоверна

Билет№ 24

Проверка выпадов (артефактов) Артефакты-такие значения признака, которые резко отличаются от всех других значений признака в группе. Проверка артефактов должна проводиться всегда перед началом обработки полученных первичных данных. , где Т — критерий выпада;

— выделяющееся значение признака (или очень большое или очень малое);

μ, s –средняя и сигма, рассчитанные для группы, включающей артефакт;

Если Т > Tst – то артефакт д/б исключен из выборки

Tst –стандартные значения критерия выпадов определяются по табл.

2. Оценка разности генеральных средних если в одном совхозе средний суточный привес каждого из откормочников за год был 810 г, а в другом — 800 г, то не может быть никакого сомнения в том, что в первом совхозе привес за данный год больше, чем во втором, и при том на полную величину полученной разности: 810—800=+ 10 г. Совершенно по-другому оценивается разность между двумя выборочными средними. При анализе такой разности всегда возникает вопрос о ее достоверности, т. е. о том, правильно ли разность между двумя выборочными средними характеризует ту генеральную разность средних, которая имеется между двумя соответствующими генеральными совокупностями.Например, в совхозе, разводящем одну породу свиней, при оптимальных условиях средний суточный привес за, год составляет 810 г. В соседнем совхозе, разводящем другую породу -800 г. Можно ли на основании полученной разности (810—800=+ 10 г) заключить, что все откормочники первой породы при данных условиях будут давать привесы, большие на 10 г в сутки по сравнению с откормочниками второй породы? Такого заключения сделать пока нельзя.

В данном случае каждая из сравниваемых групп — это серийные выборки: первая из первой породы, вторая из второй породы.

Каждая из полученных средних (μ1=810 г и μ2=800 г) есть выборочная средняя и имеет свою ошибку репрезентативности. Поэтому и разность между ними также имеет ошибку репрезентативности.

Билет№ 25

Средняя и сигма суммарной группы Иногда бывает необходимо определить среднюю и сигму для суммарного распределения, составленного из нескольких распределений. При этом известны не сами распределения, а только их средние и сигмы. Тогда:

ni— численность отдельных объединяемых групп;



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-08-20 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: