Предварительный анализ статистических данных заключается в проверке соответствия их предположению о нормальном распределении параметров, для чего строю гистограмму и определяю выборочные числовые характеристики. Для построения гистограммы выполняю такую последовательность действий:
размещаю на рабочем листе Excel статистические данные наблюдений (без выбросов);
Сервис – Анализ данных – Гистограмма (рис.1);
Рис.1.Выбор инструмента анализа.
- в появившемся диалоговом окне Гистограмма ввожу в поле Входные данные интервал (диапазон) ячеек, содержащий исходные данные, и отмечаю поле Метки, т.к., таблица данных имеет заголовки;
- ввожу в поле Параметры выхода адрес ячейки, с которой должны размещаться выходные данные (выходной интервал) и щелкаю пункт Вывод графика;
- OK.
Гистограммы строю для всех признаков статистических данных и сравниваю их с кривой нормального распределения с целью убедиться, что закон распределения каждого признака близок к нормальному, как на приведенной гистограмме.
Числовые характеристики для всех признаков оцениваются по выборке с помощью инструмента анализа Описательная статистика., вызов которого осуществляется аналогично (см. рис.1). В появившемся диалоговом окне Описательная статистика ввожу таким же образом Входные данные и Параметры вывода, только вместо пункта Вывод графика отмечаю пункт Итоговая статистика.
Результаты применения инструмента Описательная статистика к данным наблюдений по результативному признаку Y1 и выбранным факторным признакамприведены на листе Excel под названием «Проверка закона распределения».
Как видно, результаты Описательной статистики дают возможность оценить справедливость предположения о нормальном распределении признаков: эксцесс и асимметричность невелики, хотя и отличаются от 0. Нормальный закон распределения факторных признаков подтверждается еще и тем, что значения медианы и моды у них совпадают или близки.
|
Корреляционный анализ
Предварительный анализ тесноты взаимосвязи параметров многомерной модели осуществляю по оценке корреляционной матрицы генеральной совокупности X по наблюдениям. Для этого использую инструмент Анализ данных в соответствии со следующим алгоритмом:
- размещаю на рабочем листе Excel статистические данные в столбцах с соответствующими заголовками (именами переменных);
- Сервис – Анализ данных – Корреляция;
- в появившемся диалоговом окне Корреляция в соответствующие поля ввожу с помощью мыши входные данные и параметры вывода (см. рис.3);
- после щелчка мышью по кнопке OK на рабочем листе появится матрица, содержащая оценки парных коэффициентов корреляции.
Отбираю для дальнейшего анализа пары переменных, имеющие наибольшие значения парных коэффициентов корреляции
( 0,4), учитывая, что чем меньше коэффициент rij, тем слабее их связь. Такими парами в приведенном примере (рис.3) являются: Y1–X11; Y1–X12; X11–X13; X12–X13; X17–X8.
Проверяю значимость коэффициентов корреляции на уровне = 0,05. Поскольку объем выборки для всех признаков одинаков и равен 53, критическое значение r кр для всех пар будет одинаково и в соответствии с таблицей Фишера–Иейтса r кр = r табл (0,05;53)< r табл(0,05;50) = 0,273. Поскольку для всех коэффициентов выполняется неравенство > r кр , коэффициенты корреляции всех отобранных пар признаков значимо отличаются от нуля, что подтверждает связь между ними.
|
Дальнейший анализ статистических данных зависит от размерности принимаемой модели. Простейший вариант – двумерная модель. Учитывая, что в приведенном примере Y1 –результирующий признак, определяющий индекс производительность труда, входит в две пары, следует рассмотреть трехмерную модель Y1–X11–X12,
где X11 – среднегодовая численность ППП, а X12 – среднегодовая стоимость основных производственных фондов(ОПФ). В остальных парах следует определить зависимости между X11 и X13, X12 и X13, X17 и X8. Здесь X5 –удельный вес рабочих в составе промышленно–производственного персонала, X6 –удельный вес покупных изделий, X7 – коэффициент сменности оборудования.
Таким образом, для математической модели задачи выбора оптимального управления деятельностью предприятия с учетом указанных показателей следует установить зависимости: Y2 = F(X4,X8) – целевая функция;
X6 = φ(X4); X8 = φ(X7); X5 = φ(X7) – ограничения.
Рис.3.Анализ парной корреляции.