Проверка нормальности распределения результатов наблюдений




КУРСОВОЙ ПРОЕКТ

Обработка результатов многократных измерений физической величины, проверка статистических гипотез и представление результата измерения

 

 


Введение

Метрология - наука об измерениях, а измерения - один из важнейших путей познания. Они играют огромную роль в современном обществе. Наука, промышленность, экономика и коммуникации не могут существовать без измерений. Каждую секунду в мире производятся миллиарды измерительных, результаты которых используются для обеспечения качества и технического уровня выпускаемой продукции, безопасной и безаварийной работы транспорта, обоснования медицинских и экологических диагнозов, анализа информационных потоков. Практически нет ни одной сферы деятельности человека, где бы интенсивно не использовались результаты измерений, испытаний и контроля. Примерно 15% затрат общественного труда расходуется на проведение измерений. По оценкам экспертов, от 3 до 9% валового национального продукта передовых индустриальных стран приходится на измерения и связанные с ними операции.

Измерения - один из важнейших путей познания природы, объединяющий теорию с практической деятельностью человека. Измерения являются основой научных знаний, служат для учета материальных ресурсов и планирования, обеспечения требуемого качества продукции, взаимозаменяемости деталей и узлов, совершенствования технологии, автоматизации производства, стандартизации, охраны здоровья и обеспечения безопасности труда и для многих других отраслей человеческой деятельности. Они количественно характеризуют окружающий материальный мир, раскрывая действующие в природе закономерности. Д.И.Менделеев очень образно выразил значение измерений для науки: "Наука начинается... с тех пор, как начинают измерять. Точная наука невозможна без меры".

Измерение - сложный процесс, включающий в себя взаимодействие ряда структурных элементов - измерительной задачи, объекта измерения, принципов, методов и средств измерения, его модели, условий измерения, наблюдателя, результата и погрешности измерения. Сам процесс измерения состоит из ряда последовательных этапов, включающих в себя постановку измерительной задачи, планирование измерительного эксперимента, непосредственно измерительный эксперимент, обработку экспериментальных данных, завершаемую анализом и интерпретацией полученных результатов, а также записью результата в соответствии с установленной формой представления. Грамотное и сознательное выполнение всех этапов измерения является залогом сведения к минимуму ошибочных выводов, сделанных по результатам измерений, и принятия решений, не приводящих к материальным и моральным потерям.


Математическая обработка результатов наблюдений

Проверка нормальности распределения результатов наблюдений

 

Сходимость результатов наблюдений можно оценить наиболее полно, если их распределение является нормальным. Поэтому исключительно важную роль при обработке результатов наблюдений играет проверка нормальности распределения.

Эта задача представляет собой частный случай более общей проблемы, заключающейся в подборе теоретической функции распределения, в некотором смысле наилучшим образом согласующейся с опытными данными.

При большом числе результатов наблюдений (n>40) данная задача решается в следующем порядке.

Группируют результаты наблюдений в порядке возрастания их значений: xmin - xmax. Весь диапазон результатов наблюдений разделяют на r интервалов шириной Dxj (J=1,..., r) и подсчитывают частоты mj, равные числу результатов, лежащих в каждом j-м интервале, т.е. меньших его правой и больших или равных левой границе. Отношения

 

Pj*=mj/n (1.1)

 

где n-общее число наблюдений, называются частостями и представляют собой статистические оценки вероятностей попадания результата наблюдений в j-й интервал. Распределение частостей по интервалам образует статистическое распределение результатов наблюдений.

Если теперь разделить частость на длину интервала, то получим величины,


pj*= Pj*/Dxj (1.2)

 

являющиеся оценками средней плотности распределениям ни интервале Dxj.

Если отложить вдоль оси результатов наблюдений интервалы Dxj в порядке возрастания индекса j и на каждом интервале построить прямоугольник с высотой, равной pj*, то получим график, называемый гистограммой статистического распределения (рисунок 1.1).

 

 

Рисунок 1.1 Гистограммой статистического распределения

 

При увеличении числа интервалов r гистограмма все больше приближается к плавной кривой, ограничивающей единичную площадь, - к графику дифференциальной функции распределения.

При построении гистограмм рекомендуется пользоваться следующими правилами:

) Число r интервалов выбирается в зависимости от числа наблюдений n (при n=4-100 r=7-9; при n=100-500 r=8-12; при n=500-1000 r=10-16; при n=1000-10000 r=12-22);

) Длины интервалов удобнее выбирать одинаковыми. Однако если распределение крайне неравномерно, то в области максимальной концентрации результатов наблюдений следует выбирать более узкие интервалы;.

) Масштабы по осям гистограммы должны быть такими, чтобы отношение ее высоты к основанию составляло примерно 5:8.

После построения гистограммы надо подобрать теоретическую плавную кривую распределения, которая, выражая все существенные черты статистического распределения, сглаживала бы все случайности, связанные с недостаточным объемом экспериментальных данных. Принципиальный вид теоретической кривой выбирают заранее, проанализировав метод измерения или хотя бы по внешнему виду гистограммы. Тогда определение аналитического вида кривой распределения сводится к выбору таких значений его параметров, при которых достигается наибольшее соответствие между теоретическим и статистическими распределениями.

Одним из методов решения этой задачи является метод моментов. При его использовании параметрам теоретического распределения придают такие значения, при которых несколько важнейших моментов совпадают с их статистическими оценками. Так, если статистическое распределение, определяемое гистограммой, приведенной на рисунке 1.1, мы хотим описать кривой нормального распределения, то естественно потребовать, чтобы математическое ожидание и дисперсия последнего совпадали со средним арифметическим и оценкой дисперсии, вычисленным по опытным данным.

Далее законно возникает вопрос, объясняются ли расхождения между гистограммой и подобранным теоретическим распределением только случайными обстоятельствами, связанными с ограниченным числом наблюдений, или они вызваны тем, что результаты наблюдений в действительности распределены иначе.

Для ответа на этот вопрос используют методы проверки статистических гипотез. Идея их применения заключается в следующем. На основании гистограммы, полученной при обработке опытных данных, строится гипотеза, состоящая в том, что результаты наблюдений подчиняются распределению F(x) с плотностью р(х).

Для того чтобы принять или опровергнуть эту гипотезу, выбирается некоторая величина U, представляющая собой меру расхождения теоретического и статистического распределений. В качестве меры расхождения можно принять сумму квадратов разностей частостей и теоретических вероятностей попадания результатов наблюдений в каждый интервал, взятых с некоторыми коэффициентами:

 

, (1.3)

 

где Cj - коэффициенты, называемые весами разрядов, Pj - теоретические вероятности, определяемые как

 

(1.4)

 

Здесь р(х)- предполагаемая плотность распределения.

Мера расхождения U является случайной величиной и, как показал К.Пирсон, независимо от исходного распределения подчиняется c2 - распределению с k степенями свободы. Если все частоты mj ³ 5 и число измерений стремится к бесконечности, то веса Cj выбираются равными (n / pj). Число степеней свободы распределения k = r - s, где r- число независимых связей, наложенных на частости pj*.

Если проверяется гипотеза о нормальности распределения, то к числу этих связей относятся равенство среднего арифметического и точечной оценки дисперсии соответственно математическому ожиданию и дисперсии предполагаемого нормального распределения. Кроме того, всегда требуется, чтобы сумма частостей по всем интервалам была равна единице. Поэтому в данном случае s=3.

Мера расхождения U, выбраним по К. Пирсону, обозначается через cк2. Для удобства вычисления можно записать в виде

 

(1.5)

 

По таблице А1 можно при заданной доверительной вероятности a=1-q найти тот доверительный интервал (cк2;q/2 и cк2;1-q/2) значений cк2 в который мера расхождения может попасть по чисто случайным причинам.

Если вычисленная по опытным данным мера расхождения cк2 окажется в указанном интервале, то гипотеза принимается. Это, конечно, не значит, что гипотеза верна. Можно лишь утверждать, что она правдоподобна, т.е. не противоречит опытным данным. Если же cк2 выходит за границы доверительного интервала, то гипотеза отвергается как противоречащая опытным данным.

Поскольку проверка гипотезы основывается на опытных данных, то при принятии решения всегда возможны ошибки. Отвергая в действительности верную гипотезу, мы совершаем ошибку первого рода. Вероятность ошибки первого рода называется уровнем значимости и составляет q = 1- a. Принимая в действительности неверную гипотезу, мы совершаем ошибку второго рода. Вычислить ее вероятность невозможно, поскольку для этого нужно рассмотреть все прочие возможные гипотезы, являющиеся альтернативой обсуждаемой гипотезы. Можно лишь утверждать, что при уменьшении ошибки первого рода ошибка второго рода увеличивается, поэтому не имеет смысла брать слишком высокие значения доверительных вероятностей.

Описанная процедура проверки гипотезы о том, что данное статистическое распределение является распределением с плотностью р(х), называется критерием согласия c2.

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2020-03-31 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: