Проверка закона распределения

Предварительный анализ статистических данных заключается в проверке соответствия их предположению о нормальном распределении параметров, для чего строю гистограмму и определяю выборочные числовые характеристики. Для построения гистограммы выполняю такую последовательность действий:

размещаю на рабочем листе Excel статистические данные наблюдений (без выбросов);

Сервис – Анализ данных – Гистограмма (рис.1);

Рис.1.Выбор инструмента анализа.

- в появившемся диалоговом окне Гистограмма ввожу в поле Входные данные интервал (диапазон) ячеек, содержащий исходные данные, и отмечаю поле Метки, т.к., таблица данных имеет заголовки;

- ввожу в поле Параметры выхода адрес ячейки, с которой должны размещаться выходные данные (выходной интервал) и щелкаю пункт Вывод графика;

- OK.

Гистограммы строю для всех признаков статистических данных и сравниваю их с кривой нормального распределения с целью убедиться, что закон распределения каждого признака близок к нормальному, как на приведенной гистограмме.

Числовые характеристики для всех признаков оцениваются по выборке с помощью инструмента анализа Описательная статистика., вызов которого осуществляется аналогично (см. рис.1). В появившемся диалоговом окне Описательная статистика ввожу таким же образом Входные данные и Параметры вывода, только вместо пункта Вывод графика отмечаю пункт Итоговая статистика.

Результаты применения инструмента Описательная статистика к данным наблюдений по результативному признаку Y1 и выбранным факторным признакамприведены на листе Excel под названием «Проверка закона распределения».

Как видно, результаты Описательной статистики дают возможность оценить справедливость предположения о нормальном распределении признаков: эксцесс и асимметричность невелики, хотя и отличаются от 0. Нормальный закон распределения факторных признаков подтверждается еще и тем, что значения медианы и моды у них совпадают или близки.

Корреляционный анализ

Предварительный анализ тесноты взаимосвязи параметров многомерной модели осуществляю по оценке корреляционной матрицы генеральной совокупности X по наблюдениям. Для этого использую инструмент Анализ данных в соответствии со следующим алгоритмом:

- размещаю на рабочем листе Excel статистические данные в столбцах с соответствующими заголовками (именами переменных);

- Сервис – Анализ данных – Корреляция;

- в появившемся диалоговом окне Корреляция в соответствующие поля ввожу с помощью мыши входные данные и параметры вывода (см. рис.3);

- после щелчка мышью по кнопке OK на рабочем листе появится матрица, содержащая оценки парных коэффициентов корреляции.

Отбираю для дальнейшего анализа пары переменных, имеющие наибольшие значения парных коэффициентов корреляции

( 0,4), учитывая, что чем меньше коэффициент r_ij, тем слабее их связь. Такими парами в приведенном примере (рис.3) являются: Y1–X11; Y1–X12; X11–X13; X12–X13; X17–X8.

Проверяю значимость коэффициентов корреляции на уровне = 0,05. Поскольку объем выборки для всех признаков одинаков и равен 53, критическое значение r _крдля всех пар будет одинаково и в соответствии с таблицей Фишера–Иейтса r _кр= r _табл(0,05;53)< r _табл(0,05;50) = 0,273. Поскольку для всех коэффициентов выполняется неравенство > r _кр, коэффициенты корреляции всех отобранных пар признаков значимо отличаются от нуля, что подтверждает связь между ними.

Дальнейший анализ статистических данных зависит от размерности принимаемой модели. Простейший вариант – двумерная модель. Учитывая, что в приведенном примере Y1 –результирующий признак, определяющий индекс производительность труда, входит в две пары, следует рассмотреть трехмерную модель Y1–X11–X12,

где X11 – среднегодовая численность ППП, а X12 – среднегодовая стоимость основных производственных фондов(ОПФ). В остальных парах следует определить зависимости между X11 и X13, X12 и X13, X17 и X8. Здесь X5 –удельный вес рабочих в составе промышленно–производственного персонала, X6 –удельный вес покупных изделий, X7 – коэффициент сменности оборудования.

Таким образом, для математической модели задачи выбора оптимального управления деятельностью предприятия с учетом указанных показателей следует установить зависимости: Y2 = F(X4,X8) – целевая функция;

X6 = φ(X4); X8 = φ(X7); X5 = φ(X7) – ограничения.

Рис.3.Анализ парной корреляции.

Проверка закона распределения

Поиск по сайту