(2.12)
Размах вариации - R
R = max. Xi - min Xi (2.13)
Асимметрия - As
(2.14)
или
(2.15)
Эксцесс - Ex
(2.16)
или
(2.17)
Средние величины являются обобщающими количественными характеристиками совокупности однотипных явлений по варьирующему признаку. Среднее арифметическое характеризует среднее значение, около которого группируются возможные значения случайной величины, а дисперсия есть мера разбросанности этих значений относительно среднего. Среднее квадратичное отклонение, так же как и дисперсия, является мерой колеблемости, но в отличие от дисперсии представляет собой абсолютную величину, выраженную в тех же единицах, что и варианты. Коэффициент вариации является относительным показателем колеблемости. Вариационный размах (или широта распределения) неустойчивая, чрезвычайно зависящая от случайностей величина, служащая для приблизительной оценки вариации.
Асимметрия и эксцесс являются показателями отклонения функции распределения f(x) для X от нормального закона распределения.
Если As = 0, то кривая для f(x) симметрична, при As ¹ 0 - асимметрична. Эксцесс характеризует крутизну кривой распределения.
Если Ex ¹ 0, то вершина кривой для f(x) находится либо выше (при Ex > 0), либо ниже (при Ex < 0) вершины кривой нормального распределения.
1.3. Интервальные оценки параметров распределения
В п.1.2. были рассмотрены точечные оценки некоторых характеристик распределения случайной величины X через характеристики выборки. Поэтому точечные оценки сами являются случайными величинами, законы которых зависят от закона распределения X и объема выборки n [2]. Чтобы дать представление о точности и надежности точечных оценок используют так называемые доверительные интервалы и доверительные вероятности.
|
Доверительным интервалом для некоторой характеристики Q называют такой интервал (e1,e2), который с заранее выбранной вероятностью Ã содержит истинное значение параметра Q, т.е.
P (e1 < Q < e2) = Ã. (2.18)
Здесь Ã называют доверительной вероятностью. Обычно значение Ã выбирают близкое к единице: 0,9; 0,95; 0,99; 0,999. a = 1 - Ã называют уровнем значимости.
1.3.1. Построение доверительного интервала для математического ожидания
Если случайная величина X подчиняется нормальному закону распределения, то доверительный интервал для истинного значения x измеряемой величины может быть построен следующим образом.
Первый способ. Доверительная оценка при известной точности измерений.
Если заранее известно среднее квадратичное отклонение (или другая связанная с ней характеристика точности измерений), то доверительный интервал имеет вид
(2.19)
где n - объем выборки, `x - среднее арифметическое, t(Ã) определяется по заданной доверительной вероятности из условия [1,2]:
2 Ф(t) = Ã (2.20)
Здесь Ф(t) = - функция Лапласа, значения которой представлены в таблице приложения 1.
Второй способ. Доверительная оценка при неизвестной точности измерений.
Если среднее квадратичное отклонение s заранее неизвестно, то вместо него используют эмпирическое отклонение. Известно [2], что статистика
(2.21)
подчиняется закону Стьюдента с f = n - 1 степенями свободы. Исходя из этого, доверительный интервал в данном случае имеет вид [1,2]
(2.22)
где t (Ã, n - 1) зависит и от объема выборки. t (Ã, n - 1) определяется из таблицы приложения 2.
|
1.3.2.Построение доверительного интервала для дисперсии и среднего квадратичного отклонения.
Известно [2], что статистика
(2.23)
подчиняется закону распределения Пирсона или «c - распределению » с f = n - 1 степенями свободы. Исходя из этого, доверительный интервал для дисперсии s2 случайной величины имеет вид [1,2]
(2.24)
где c12 и c22 - значения, определяемые из таблиц для распределения Пирсона ([3], приложение 5) соответственно для вероятностей Ã1 = (1 - Ã) / 2 и Ã2 = = (1 + Ã) / 2 и числа степеней свободы f = n - 1.
Пусть , тогда (2.24) примет вид
g12 × S*2 < s2 < g22 × S*2, (2.25)
где значения g2 протабулированы для n и Ã (приложение 4).
Для интервальной оценки среднего квадратичного отклонения служит неравенство
g1 × S* < s < g2 × S*. (2.26)
2. ИСПОЛЬЗОВАНИЕ ЭВМ
2.1. Использование программного продукта MATHCAD
Можно рекомендовать следующий алгоритм выполнения работы с использованием программного продукта MATHCAD.
1.Выписать из таблицы данные для одного статистического ряда.
2.Загрузить MATHCAD. Набрать m:=30(m – объем выборки или количество вариант в данном статистическом ряду), А:=. На математической палитре выбрать «Векторы и матрицы». Сформировать свой вектор, задав число строк матрицы, равное 1, а число столбцов, равное объему выборки. При вводе чисел в матрицу используйте клавишу “Tab” или мышь.
3.Для удобства преобразуем вектор-строку А в вектор-столбец Х. Для этого наберем ниже x:=AT с помощью палитры «Векторы и матрицы», выбрав там операцию транспонирования.
|
4.Для того чтобы построить дискретный вариационный ряд отсортируем данные в порядке возрастания: x1:=sort(x). Чтобы вывести результат напишем x1T=, нажмем клавишу «Enter» или щелкнем левой кнопкой мыши в произвольном месте, рядом со знаком равно получим результат. По получившейся таблице составим вариационный ряд, подсчитывая вручную частоты вариант. Наберем М1:=. Используя палитру «Векторы и матрицы» сформируем матрицу, состоящую из двух строк и стольких столбцов, сколько встречается различных вариант. В первую строку вводим значения вариант, а во вторую – значения соответствующих частот. Это и будет дискретный вариационный ряд.
5.Для того, чтобы построить полигон, на математической палитре выбираем палитру «Графики», а на ней «Декартов график». Заполняя рабочую область с помощью палитры «Векторы и матрицы», по оси абсцисс вводим (М1Т)<0>, а по оси ординат – (М1Т)<1>. Щелкнув мышью вне области графика, получим полигон частот.
6.Для построения интервального вариационного ряда воспользуемся формулой Стэрджеса, чтобы найти оптимальный шаг.
Введем . Выведем значение h. Округлим полученное значение до одного знака после запятой и введем его в качестве h. Посчитаем число интервалов:
и выведем его. Сформируем границы интервалов: j:=1..ml+1; x1i:=min(xl); x2j:=x1i+h*(j-1,5).
Выведем полученные значения x1i=; x2т=.
Подчитаем число вариант, попавших в каждый интервал:
L:=hist(x2,x1т).
Таким образом, интервальный вариационный ряд имеет вид x1т, Lт.
7. Для того чтобы построить гистограмму найдем относительные плотности частот, которые получим следующим образом:
. Затем на палитре «Графики» выбрать трехмерную гистограмму. В рабочей области гистограммы ввести массив L, щелкнув мышью вне графика, получим изображение гистограммы. В отчете необходимо будет проставить концы интервалов по оси Х самостоятельно.
8. Для построения кумулятивной кривой необходимо сначала получить матрицу накопленных частот. Для этого введем следующее:
g:=(M1т)<1>, i:= 0..0,i1 yi= yт=.,
где yi – значения накопленных частот, il – количество столбцов в матрице М1.
При построении кривой воспользуемся палитрой «Декартов график». Заполняя рабочую область, по оси X введем X введем (М1т))<0>, а по оси Y – g. Щелкнув мышью вне области графика, получим изображение искомой кривой.
9. Для нахождения числовых характеристик: среднего выборочного, средней выборочной дисперсии, выборочного среднего квадратичного отклонения, размаха выборки и др. необходимо ввести соответствующие формулы с помощью математической палитры и встроенных в нее палитр и рядом вывести получившиеся значения. Например,
среднее выборочное xcp=;
выборочная дисперсия S*2:= S*2=;
выборочное среднее квадратичное отклонение
S*: S*=
10. 10.Для того чтобы доверительный интервал для математического ожидания при неизвестной точности измерений необходимо воспользоваться следующей формулой:
<М[x]< ,
где
- выборочная средняя;
- квантиль распределения Стьюдента;
Р – доверительная вероятность;
n – объем выборки;
S* - исправленное среднее квадратичное отклонение.
Взяв значения выборочных характеристик из п.8, а квантиль распределения из таблиц, найдем значения концов интервала ε1, ε2.
Пусть Р:=0,95, m:=30, t:=2,05
ε1:= xcp- ε1=;
ε2:= xcp- ε2=.
11. Для того чтобы построить доверительный интервал для дисперсии, необходимо по таблицам найти квантали распределения Пирсона и воспользоваться следующими формулами:
S*2<D[x]< S*2 или S*2<D[x]< S*2
Здесь
= , =
Где х2(Р,n) – квантиль распределения Парсона;
S*2 – исправленная выборочная дисперсия;
n – объем выборки;
, - табличные значения (см.[4]).
Зададимся доверительной вероятностью Р:=0,99, по таблицам найдем
:= 0,554, :=2,21.
Тогда δ1:= . S*2; δ2:= . S*2; δ1:=; δ1:=.
Искомый интервал и будет (δ1, δ2).