Статистика – это научное направление, объединяющие принципы и методы работы с числовыми данными, характеризующими массовые явления. Оно включает в себя математическую статистику, общую теорию статистики и целый ряд отраслевых статистик (статистика промышленности, статистика финансов, статистика народонаселения и другие).
Предметом математической статистики является изучение случайных величин по результатам наблюдений. Для получения опытных данных необходимо провести обследование соответствующих объектов. Например, если исследователя интересует вероятность того, что диаметр валика определенного типоразмера после шлифовки окажется за пределами технического допуска, то надо знать закон распределения этого диаметра, а для этого прежде всего нужно располагать набором возможных значений диаметра. Однако обследовать все валики зачастую трудно, поскольку их количество может быть велико. Поэтому приходится из всей совокупности объектов для обследования отбирать только часть, то есть проводить выборочное обследование. В некоторых случаях обследование объектов всей совокупности практически не имеет смысла, поскольку они разрушаются в результате обследования. Таким образом, основным методом статистики является выборочный метод.
Выборочной совокупностью или выборкой называют совокупность случайно отобранных объектов.
Генеральной совокупностью называют совокупность объектов, из которых производится выборка.
Объемом совокупности (выборочной или генеральной) называют число объектов этой совокупности. Например, если из 1000 деталей отобрано для обследования 100 деталей, то объем генеральной совокупности N=1000, а объем выборки n=100.
|
Для того, чтобы по выборке можно было достаточно уверенно судить о случайной величине, выборка должна быть представительной (репрезентативной). Репрезентативность выборки означает, что объекты выборки достаточно хорошо представляют генеральную совокупность. Заметим, что при отборе объектов могут сыграть роль личные мотивы или психологические факторы, о которых исследователь, проводящий выборку, и не подозревает. При этом, как правило, выборка не будет репрезентативной.
После того как сделана выборка, то есть получена выборочная совокупность объектов, все объекты этой совокупности обследуют по отношению к определенной случайной величине или в результате этого получают наблюдаемые данные.
Задача математической статистики заключается в обработке результатов наблюдений.
Статистическая информация и способы ее представления.
Статистическая информация – это числовые данные о массовых явлениях, это значения наблюдаемых признаков объектов, составляющих статистическую совокупность, которая получена в результате статистического наблюдения. Таким образом, источником статистической информации является реальный опыт, эксперимент, наблюдение, измерение, производимые над реальными объектами и явлениями окружающего мира. Статистика начинается с реальных данных реального опыта; этим она отличается от теории вероятностей, которая изучает математические модели реальных явлений и имеет дело лишь с мысленными (воображаемыми) экспериментами.
Статистика использует методы исследования, основанные на математическом аппарате теории вероятностей, и важнейшим среди этих методов является выборочный метод. Поэтому математическая статистика и теория вероятностей неразрывно связаны между собой, постоянно взаимодействуют, и между ними не существует четкой и общепризнанной границы.
|
Статистическая информация о результатах наблюдений или экспериментов может быть зарегистрирована и представлена в различных формах.
1) Простой статистический ряд, или ряд данных, или выборка: х1, х2, х3, …, хn-1, хn – запись результатов в порядке их появления (или получения), запись в ряд. Отдельные значения хi, составляющие этот ряд, называют вариантами или просто данными, или результатами наблюдений. Количество вариант в ряду n называют объемом ряда, или объемом выборки.
Например, игральный кубик бросили 12 раз и записали выпавшие числа в порядке их появления: 3, 4, 5, 6, 6, 6, 5, 1, 4, 6, 1, 4 (п=12).
Недостатки: громоздкость и труднообозримость.
2) Вариационный ряд, или упорядоченный.
1, 1, 3, 4, 4, 4, 5, 5, 6, 6, 6, 6.
Недостаток: громоздкость.
3) Статистическое распределение ряда:
xj | |||||
nj |
Величины nj называются частотами значений варианты хj. Значение варианты хj и варианты хi – это не одно и то же: каждое значение фиксируется только один раз, а варианты с таким значением могут встречаться в ряду многократно. (j=1, 2, 3, 4, 5; i=1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12). j=1, 2, …, m, а i=1, 2, …, n, причем всегда m£n (если m=n, то все варианты в ряду разные).
Наряду с частотами используются относительные частоты .
4) Интервальный ряд: весь диапазон наблюдаемых значений признака хmax-xmin разбивают на небольшое число (k=6 … 10) частичных интервалов, и подсчитывают количество вариант исходного ряда, попадающих в каждый частичный интервал.
|
5) Графическая форма: столбчатая диаграмма, полигон частот, гистограмма, круговая диаграмма.
Задачи:
1. Рост каждого из 50 одиннадцатиклассников занесли в таблицу:
По имеющимся данным составить таблицу распределения значений случайной величины Х – роста одиннадцатиклассников: а) по частотам (М); б) по относительным частотам (W).
2. После группировки данных эксперимента получилась такая таблица их распределения:
Варианта | -3 | ||||||||
Кратность варианты |
а) Определите объем выборки.
б) Найдите наиболее часто встретившуюся варианту.
в) Допишите к таблице третью и четвертую строки из частот и процентных частот вариант.
г) Найдите сумму чисел в третьей и четвертой строках.
Сделайте выводы.
Могут быть использованы следующие задачи: С10, С14, С23, С25, С34, С36, С42, С49