Введение в математическую статистику
Математическая статистика – это раздел прикладной математики, посвящённый методам сбора, группировки и анализа статистических сведений, полученных в результате наблюдений или экспериментов.
Основные понятия математической статистики
Единица наблюдения – элемент группового объекта.
Статистическая совокупность – множество относительно однородных, но индивидуально различных единиц наблюдения, объединённых для совместного изучения.
Статистический комплекс – множество разнородных статистических совокупностей, объединённых для совместного изучения.
Признак – величина, характеризующая однородность объектов
Классификация признаков:
Статистические совокупности.
Генеральная совокупность – это множество всех объектов, однородных некоторого признака.
Объём генеральной совокупности N - число объектов генеральной совокупности.
Выборочная совокупность (выборка) - совокупность случайно отобранных объектов.
Объём выборки n - число объектов выборки
Варианта - численное значение количественного признака.
Выборки бывают повторные и бесповторные.
Репрезентативность выборки - все объекты генеральной совокупности имеют одинаковую вероятность попасть в выборку.
Способы группировки данных.
Группировка - процесс объединения в относительно однородные группы по некоторому признаку.
Дискретный статистический ряд.
Статистическим распределением выборки называют перечень вариант и соответствующих им частот или относительных частот.
xi | x1 | x2 | x3 | … | xk |
mi | m1 | m2 | m3 | … | mk |
pi* | … |
n= - объем выборки.
- условие нормировки
Графическое изображение дискретного статистического ряда – полигон относительных частот (или частот).
Интервальный статистический ряд.
Частичные интервалы | [x1, x2) | [x2, x3) | … | [xk, xk+1) | ||
Середины интервалов | … | |||||
Частоты попадания в интервал | mi | m1 | m2 | mk | ||
Относительные частоты попадания в интервал | Pi* | … | ||||
Плотность частот | … | Гистограмма частот | ||||
Плотность относительных частот | … | Гистограмма относительных частот | ||||
Накопленная частота | å mi | m1 | m1 + m2 | … | n | Кумулята |
Алгоритм построения гистограммы.
1. Дана выборка Х = {x1, x2, …, xn}; n – её объём
2. Размах выборки D = xmax – xmin
3. Число классов К=1+3,322·lg n (формула Стерджесса для n < =100)
4. Величина классового интервала Dx = D / К
5. Границы и середины частичных интервалов
x1л=xmin– Dx/2 1 = xmin
x1пр =x2л=xmin +Dx/2 2 = 1 + Dx
6. Частоты попадания в интервал:
[xi, xi+1) | [x1л, x2л) | [x2л, x3л) | [x3л, x4л) | |
Шифр (код) | : | :. | :__: | |
mi | 2 | 3 | 5 |
7. Построить гистограмму и кумуляту.
8. Сделать выводы
Статистические оценки параметров распределения
Статистическая оценка неизвестного параметра распределения генеральной совокупности - функция от наблюдаемых случайных величин.
q – неизвестный параметр; q* – статистическая оценка неизвестного параметра; q* = f (x1, x2, …, xn)
Виды статистических оценок: точечные и интервальные.
Оценка одним числом, зависящим от выборочных данных, называется точечной.
Оценка двумя числами, являющимися концами интервала, называется интервальной.
Требования к точечным статистическим оценкам.
Ø несмещённость (отсутствие систематических ошибок при любом объёме выборки М(q*) = q);
Ø эффективность (среди всех возможных оценок эффективная оценка обладает наименьшей дисперсией min D(q*));
Ø состоятельность (стремление по вероятности к оцениваемому параметру при n ® ¥, т.е. q* q).