Статистическое распределение выборки




ЛЕКЦИЯ 3

ЭЛЕМЕНТЫМАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

Основные понятия математической статистики

Математическая статистика - раздел математики, в котором изучаются методы сбора, систематизации, обработки и интерпретации результатов наблюдений случайных массовых явлений с целью выявления существующих закономерностей.

Основные задачи математической статистики:

· получение выводов о наблюдаемых массовых явления или процессах на основе данных из наблюдений или опытов;

· установление закономерностей, которым подчиняются наблюдаемые явления.

Признаки и переменные.

Для изучения случайных величин проводится ряд независимых опытов, в которых эти случайные величины принимают определенные значения. Сами случайные величины в статистике принято называть признаками или переменными.

Изучаемые признаки могут быть качественными и количественными.

К количественным признакам применяются понятия показатель или уровень.

Качественные признаки описываются словесно.

Например, при описании состояния больного количественным признаком могут быть температура, давление, пульс, а качественным - описание состояния больного как нормальное, средней тяжести, тяжелое.

Любое эмпирическое научное исследование начинается с того, что исследователь фиксирует выраженность интересующего его признака у объекта или объектов исследования. Измерение – это приписывание объекту числа по определенному правилу. Это правило устанавливает соответствие между измеряемым свойством и его значением.

1.2. Выборочный метод, основные понятия и принципы

Генеральной совокупностью называют множество всех объектов, обладающих изучаемым признаком. Число объектов генеральной совокупности называют объемом генеральной совокупности и обозначают N. Генеральная совокупность определяется задачей исследования.

Пример 1. Изучается тревожность у мужчин и женщин, работающих на каком-либо предприятии.

 

 

Пример 2. Изучается агрессивность у подростков города Томска.

Пример 3. Изучается партия психотропных таблеток, поступивших на склад, на содержание действующего вещества.

 

В подавляющем большинстве случаев генеральная совокупность недоступна для изучения в силу следующих причин:

· большой объем генеральной совокупности, что ведет к трудоемким и дорогостоящим исследованиям;

· недоступность всех объектов генеральной совокупности;

· изучение объекта генеральной совокупности в ряде случаев ведет к его разрушению.

В качестве примера, иллюстрирующего первые две приведенные выше причины, можно привести пример 2 (количество подростков в городе Томске велико и не все доступно для исследования). Для иллюстрации третьей причины подходит третий пример: если все таблетки партии, поступившей на склад, изучить на содержание действующего вещества, то вся партия будет уничтожена.

Чтобы не изучать всю генеральную совокупность, из нее делают выборку.

Выборкой или выборочной совокупностью называют множество объектов, отобранных случайным образом из генеральной совокупности для изучения. Количество объектов в выборке называют объемом выборки и обозначают n.

Чтобы выборка являлась хорошей моделью генеральной совокупности, она должна быть репрезентативной (или представительной). Это означает, что все объекты генеральной совокупности должны иметь одинаковые шансы попасть в выборку.

Можно выделить два основных вида отбора:

· Простой случайный отбор (в силу закона больших чисел выборка будет являться репрезентативной, если будет сделана случайным образом). Простой случайный отбор может быть повторным (объект после изучения возвращается в генеральную совокупность и может быть выбран повторно) и бесповторный (объект не возвращается в генеральную совокупность). При большом объеме N генеральной совокупности и малом относительном объеме выборки разница между повторной и бесповторной выборками незначительна.

· Стратифицированный отбор (отбор по свойствам генеральной совокупности). Стратифицированный отбор требует предварительного определения тех качеств, которые могут повлиять на изменчивость изучаемого свойства, затем определяется процентное соотношение численности групп в генеральной совокупности и обеспечивается такое же соотношение в выборке.

Сущность выборочного метода состоит в том, чтобы по выборке, т.е. по некоторой части генеральной совокупности, выносить суждение о свойствах генеральной совокупности в целом.

Статистическое распределение выборки

Пусть для изучения количественного признака Х из генеральной совокупности извлечена выборка объема n.

Возможные значения признака Х называют вариантами, обозначают , где индекс обозначает номер данной варианты.

Частота варианты – это количество повторений данной варианты в выборке, обозначается . Сумма всех частот должна быть равна объему выборки:

.

Относительной частотой варианты называют отношение частоты варианты к объему выборки, обозначают (). Сумма всех относительных частот должна быть равна единице:

.

Вариационным рядом называют последовательность вариант, записанных в порядке возрастания.

Статистическим распределением выборки называется соответствие между вариантами и их частотами или относительными частотами .

Статистическое распределение выборки может быть представлено в виде безинтервального ряда или в виде интервального ряда.

Ø Безинтервальный (дискретный) ряд строится в том случае, когда число различных вариант мало (малый объем выборки или при большом объеме выборки мало различных вариант).

Ø Интервальный ряд строится в том случае, когда объем выборки большой, изучаемый признак непрерывен, много различных вариант.

Безинтервальный ряд может быть представлен двумя способами:

1) в виде таблицы, в первой строке которой перечисляются варианты в порядке возрастания, во второй строке – частоты или относительные частоты. Такая таблица называется статистическим дискретным рядом распределения выборки и является группированным видом представления выборки.

или

2) в виде графика, в котором по оси абсцисс откладываются варианты, а по оси ординат – частоты или относительные частоты. По данным выборки наносятся точки и соединяются отрезками. Полученная ломаная называется полигоном частот (или относительных частот).

Пример. При измерении систолического артериального давления у 12 случайным образом отобранных пациентов клиники получены следующие результаты: 120, 130, 105, 130, 140, 120, 140, 130, 120, 130, 115,150 (в мм рт. ст.). Построить статистический дискретный ряд распределения и полигон частот.

Решение.

           
           

 

Полигон частот имеет вид:

Суть построения интервального ряда состоит в следующем: весь диапазон изменений признака разбивается на частичные интервалы и учитывается не каждая варианта, а число объектов выборки, попавших в данный интервал.

Порядок построения интервального ряда:

1) Находят в выборке максимальное и минимальное значение и вычисляют размах выборки – разность между максимальным и минимальным значением: .

2) Определяют длину частичного интервала по формуле: , где - это объем выборки, а знаменатель дроби - количество частичных интервалов. Найденное значение округляют до ближайшего четного числа с тем же количеством знаков после запятой, что и сами измерения в выборке.

3) Определяют начало первого интервала таким образом, чтобы минимальная варианта попала в его середину: .

4) Строят таблицу, в первую строку которой записывают частичные интервалы:

Интервалы записывают до тех пор, пока не перейдут за .

5) Во второй строке таблицы подсчитывают количество объектов выборки, попавших в тот или иной интервал (для этого удобен метод «конвертов»). Варианта, попавшая на границу между интервалами, относится в следующий интервал. Чтобы отличить от дискретного ряда, где подсчитывается частота каждой варианты, количество значений, попавших в тот или иной интервал, обозначаем .

Полученная таблица называется статистическим интервальным рядом распределения выборки.

Графическим представлением интервального ряда является гистограмма частот или гистограмма относительных частот. Для построения гистограммы по оси абсцисс откладывают частичные интервалы, а по оси ординат отношения частоты или относительные частоты к длине интервала. В результате получается фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы, а высотами - отношения .


Пример. На основании многолетних клинических наблюдений, проводившихся в Сухумском питомнике обезьян, составлена выборка 100 анализов на содержание кальция (мг%) в сыворотке крови клинически здоровых особей:

13.6; 12.9; 12.3; 9.9; 12.7; 11.8; 10.8; 10.4; 10.9; 10.2; 14.1; 10.1; 11.6; 11.7; 12.1; 10.9; 12.1; 9.7; 10.7; 11.5; 13.1; 10.9; 12.0; 11.1; 12.0; 11.2; 13.5; 10.1; 14.0; 10.0; 11.6; 12.4; 11.9; 11.4; 12.8; 11.4; 10.9; 12.7; 12.1; 13.2; 11.9; 10.8; 11.0; 12.6; 10.0; 10.3; 12.1; 11.7; 12.1; 10.8; 12.9; 11.9; 11.6; 10.6; 11.1; 10.7; 12.3; 11.5; 11.2; 11.5; 12.7; 10.5; 11.2; 11.9; 13.0; 9.7; 9.6; 12.5; 11.6; 9.6; 11.5; 12.3; 12.8; 12.6; 11.8; 12.5; 12.8; 11.4; 11.0; 10.8; 14.0; 12.4; 12.0; 11.7; 12.2; 12.3; 11.6; 12.0; 12.5; 12.0; 11.6; 11.9; 12.0; 11.4; 11.2; 11.3; 13.2; 11.5; 13.2; 11.2.

Представить эти данные в виде интервального статистического ряда распределения и построить гистограмму относительных частот.

Решение. Объем выборки известен: .

1. Найдем размах выборки

2. Найдем длину h частичного интервала

.

3.. Найдем начало первого частичного интервала:

.

В результате получаем следующие частичные интервалы: , , , , , , , .

4. Найдем число наблюдаемых значений в каждом i – ом частичном интервале (частоты интервалов), а также относительные частоты (i = 1,2,…,8). Полученные данные представим в виде таблицы:


 

 

Интервальный ряд

 

Част. инт. [9,3 - 9,9) [9,9 -10,5) [10,5 -11,1) [11,1-11,7) [11,7-12,3) [12,3-12,9) [12,9-13,5) [13,5-14,1)
               
0,04 0,08 0,14 0,23 0,22 0,17 0,07 0,05`
0,07 0,13 0,23 0,38 0,37 0,28 0,12 0,08

Данная таблица называется статистическим интервальным рядом распределения выборки. Для построения гистограммы относительных частот, найдем отношения .

Используя данные таблицы, построим гистограмму относительных частот:



Построение дискретных и интервальных рядов, графическое изображение рядов в виде полигонов и гистограмм позволяет получить первоначальное представление о закономерностях, которые имееют место в совокупности результатов наблюдений.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-03-31 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: