В целях упрощения анализа статистических рядов и придания им большей наглядности используют графические представления. Основными видами графического представления статистических рядов являются гистограмма, полигон частостей и полигон накопленных частостей. Для визуального представления можно использовать как частости, так и частоты. Ограничимся рассмотрением частости, поскольку этот параметр более информативен.
Наиболее часто для анализа статистического ряда используется гистограмма, представляющая собой совокупность примыкающих друг к другу прямоугольников, основание каждого из которых равно ширине интервала группировки, а площадь - частости этого интервала.
Гистограмма строится в декартовой (прямоугольной) системе координат следующим образом. По оси абсцисс откладываются отрезки, отображающие интервалы группировки, а затем на каждом из них строится прямоугольник, площадь которого равна частости данного интервала. Для удовлетворения этому требованию высота прямоугольника выбирается равной частному от деления частости интервала на его ширину Hi= f i/ h i. В случае, если все интервалы группировки имеют одинаковую ширину, высоты прямоугольников пропорциональны соответствующим частостям. Полная площадь гистограммы равна единице, что следует из способа ее построения. Действительно, площадь каждого из прямоугольников равна частости, а сумма всех частостей - единица.
В качестве примера на рис. 1 приведена гистограмма распределения результатов, показанных на соревновании в толкании ядра, и построенная для статистического ряда, образованного по данным столбцов 2 и 6 таблицы 4.
Рис. 1. Гистограмма
|
С увеличением числа экспериментальных данных можно использовать большее количество интервалов, имеющих меньшие ширины. Гистограмма при этом будет все более и более приближаться к некоторой кривой, ограничивающей площадь, равную единице. Эта кривая представляет собой не что иное как график плотности распределения (или, по-другому, плотности вероятности) исследуемой случайной величины. Таким образом, гистограмма является экспериментальным аналогом плотности распределения.
Другим распространенным способом графического представления статистических рядов является полигон частостей. Полигон частостей отображает зависимость частости от срединных значений интервалов. Полигон частостей строится в декартовой системе координат путем соединения прямыми линиями точек, абсциссы которых равны срединным значениям интервалов, а ординаты - частостям этих интервалов. Эти данные располагаются в третьем и шестом столбцах таблицы 4.
Полигон частостей может быть получен из гистограммы путем соединения середин верхних сторон прямоугольников гистограммы отрезками прямых. Полигон частостей для рассматриваемого примера изображен на рис. 2.
Рис. 2. Полигон частостей
Полигон частостей может оказаться более удобным и наглядным способом графического представления, чем гистограмма, в том случае, когда признак является непрерывным и его распределение описывается плавной зависимостью.
Полигон накопленных частостей представляет собой зависимость накопленных частостей от значений верхних границ интервалов. Полигон накопленных частостей строится в декартовой системе координат посредством соединения прямыми линиями точек, абсциссы которых равны значениям верхних границ интервалов, а ординаты - накопленным частостям этих интервалов. Эти данные располагаются во втором и седьмом столбцах таблицы 4. Полигон накопленных частостей для рассматриваемых экспериментальных данных приведен на рис. 3.
|
Рис. 3. Полигон накопленных частостей
Полигон накопленных частостей имеет более плавную форму, чем гистограмма или полигон частостей.
С увеличением числа опытных данных в выборке и соответственно увеличением числа используемых интервалов полигон накопленных частостей будет приближаться к кривой, являющейся графиком функции распределения исследуемой случайной величины. Таким образом, он является экспериментальным аналогом функции распределения.