Определение достоверности средней при малом числе наблюдений (малая выборка).




При проведении исследований их объем не превышает 10-30 случаев. Такой объем наблюдений называется малым (или малой выборкой).

при определении статистической достоверности средней, полученной при малом числе наблюдений пользуются следующими формулами:

; где ;

d – отклонение варианты (V) от средней величины (M),

n – число наблюдений;

t – доверительный коэффициент, определяемый по специальной таблице Стьюдента (приложение).

Пример.

 

Измерен пульс у 9 человек. Надо вычислить среднюю частоту пульса и определить ее статистическую достоверность.

 

1. Строиться вариационный ряд, вычисляется средняя (М) и среднее квадратичное отклонение (s).

V d=V-M d2
  -5  
     
  -3  
  -3  
  -8  
  +2  
  +2  
  +7  
  +8  
SV=612, n=9   S=228

 

М=612/9=68 ударов в минуту

удара в минуту

2. Определяется ошибка средней арифметической величины

удара в минуту

2. Значение t определяется по таблице Стьюдента (см. приложение 1), где k=n-1, p- желаемая степень вероятности. в нашем примере число наблюдений 9, поэтому k=8, а желаемая степень вероятности p=0,95 (95%), тогда t=2.3

3. Устанавливаются пределы колебаний средней величины (ее доверительные границы): tm=1,9*2,3 » ±4. Следовательно, средняя величина пульса у 9 обследованных, равная 68 ударам в минуту, при проведении повторных исследований в 95% случаев будет колебаться в пределах 68±4, т.е. от 64 до 72 ударов.

 

Определение необходимого объема наблюдений.

В медицинских научных исследованиях часто используется выборочный метод. При этом изучается относительно малая часть всех возможных случаев, а полученные результаты (показатели, средние величины) рассматриваются в отношении всей совокупности. При обобщении всегда допускается некоторая ошибка, называемая предельной ошибкой выборки (D), которая представляет собой разницу между характеристиками генеральной и выборочной совокупности.

Предельно допустимая ошибка показателя (Dp) равна: Dpген.выб.

Предельно допустимая ошибка средней Dх=`xген.-`xвыб.

 

Величина предельно допустимой ошибки вычисляется по формулам математической статистики:

1) для показателя: Dp= , где Dp – предельная ошибка показателя,

p – величина показателя; q=1-p или 100-p или 1000-p в зависимости от основания к которому вычислен показатель;

n – число наблюдений;

t – доверительный коэффициент (при p=95% t=2, при p=99% t=3)

2) для средней: Dх= , где s - среднее квадратичное отклонение.

Из формул вычисления предельной ошибки выводятся формулы определения необходимого числа наблюдений в выборочном исследовании:

Dp= , откуда n= t2*p*q/D2 (необходимое число наблюдений для получения показателя).

Dх= , откуда n=t2*d2/D2; (необходимое число наблюдений для получения средней)

Если в результате исследований конечный результата будет выражен абсолютными величинами (в сантиметрах, кг), необходимый объем наблюдений определяется по следующей формуле: , где

t = 2 (при p=95) или t = 3 (при p = 99),

D - предельно допустимая ошибка, выбирается исследователем.

d - среднее квадратичное отклонение

 

Среднее квадратичное отклонение определяется следующим образом:

1) если подобные исследования проводились, то берется из литературных источников,

2) если подобных исследований не проводилось, делается пробное исследование, при котором вычисляется d.

ПРИМЕР.

 

Нужно определить объем наблюдений, необходимый для того, чтобы получить достоверную среднюю величину роста семилетних мальчиков при p=0.95, t=2 и D=0,5 см.

Из приведенных ранее исследований известно, что d=5 см. Тогда n= 4*25/0,25=400, т.е. для получения достоверного результата следует взять группу, состоящую из 400 семилетних мальчиков.

Если в результате исследований конечный результат будет выражен в относительных величинах (например в %), необходимый объем наблюдений определяется по следующей формуле: ; где

t = 2 (при p=95) или t = 3 (при p = 99),

D - предельно допустимая ошибка, выбирается исследователем.

p - коэффициент в %

q = 100% - p%.

Коэффициент p определяется следующим образом:

1) если подобное исследование проводилось ранее, то р берется из литературных источников;

2) если подобных исследований не проводилось, берется максимальное значение произведения p*q, которое получается, если p = q, т.е. p и q = 50%.

ПРИМЕР.

 

Нужно определить объем наблюдений, необходимый для того чтобы получить достоверные данные о распространенности какого-то заболевания у студентов старших курсов медицинского института при P=95%, t=2 и D=3% Из литературных данных известно, что интересующее нас заболевание распространено в 30%, т.е. p=30%.

q = 100-30=70%, тогда n=4*30*70/9= 933, т.е. для получения достоверного результата следует иметь 933 наблюдения.

Если литературные данные отсутствуют, то n = 4*50*50/9 = 1111, т.е. для получения достоверного результата необходимое число наблюдений 1111.

В тех случаях, когда известна численность генеральной совокупности, могут быть использованы следующие формулы (для бесповторной случайной выборки):

n = N*t2*p*q / (N*D2+t2*p*q), где N – численность генеральной совокупности.

Контрольные вопросы

1. Дайте определение вариационного ряда. Варианта. Средняя величина. Среднее квадратичное отклонение. Коэффициент вариации. Мода. Медиана.

2. Виды вариационных рядов. Особенности вычислениях основных характеристик.

3. Оценка достоверности.

4. Сравнение средних показателей

5. Определение достоверности средней при малом числе наблюдений

6. Расчет необходимого числа наблюдений.


ПРИЛОЖЕНИЕ

Таблица значений критерия t (Стьюдента)

k (n-1) Уровень вероятности р
0,95 (95 %) 0,99 (99 %) 0,999 (99,9 %)
  12,7 63,6 636,6
  4,3 9,9 31,6
  3,1 5,8 12,9
  2,7 4,6 8,6
  2,5 4,0 6,8
  2,4 3,7 5,9
  2,3 3,5 5,4
  2,3 3,3 5,1
  2,2 3,2 4,7
  2,2 3,1 4,6
  2,2 3,1 4,4
  2,1 3,0 4,3
  2,1 3,0 4,2
  2,1 2,9 4,1
  2,1 2,9 4,0
  2,1 2,9 4,0
  2,1 2,8 3,9
  2,0 2,8 3,9
  2,0 2,8 3,8
  2,0 2,8 3,8
  2,0 2,8 3,8
  2,0 2,8 3,7
  2,0 2,8 3,7
  2,0 2,7 3,7
  2,0 2,7 3,7
  2,0 2,7 3,7
  2,0 2,7 3,6
  2,0 2,7 3,6
  2,0 2,7 3,6
  2,0 2,7 3,6
¥ 1,9 2,5 3,3

 




Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-04-11 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: