Самара 2015
Оценка показателей варьирования признаков
Сводную таблицу основных статистических характеристик для одного или нескольких массивов данных можно получить с помощью инструмента EXCEL анализа данных Описательная статистика.
Входной интервал включает диапазон y, x1 и x2.
Задаем уровень надежности среднего 95%,т.е. уровень значимости будет равен 0,05.
Рисунок 1. Окно для ввода исходных данных
Объясняемая зависимая переменная y1 | Объясняющая независимая переменная x1 | Объясняющая независимая переменная x2 | |||
Среднее | 38,6185 | Среднее | 132,5785 | Среднее | 70,249 |
Стандартная ошибка | 3,55015 | Стандартная ошибка | 3,2967495 | Стандартная ошибка | 2,052560775 |
Медиана | 44,53 | Медиана | 130,58 | Медиана | 69,64 |
Мода | 17,81 | Мода | 113,17 | Мода | 81,92 |
Стандартное отклонение | 15,87675834 | Стандартное отклонение | 14,74351 | Стандартное отклонение | 9,17933084 |
Дисперсия выборки | 252,0714555 | Дисперсия выборки | 217,37114 | Дисперсия выборки | 84,2601147 |
Эксцесс | -0,95150655 | Эксцесс | -0,8959200 | Эксцесс | -1,2185243 |
Асимметричность | -0,7392406 | Асимметричность | 0,2047456 | Асимметричность | -0,2231860 |
Интервал | 49,71 | Интервал | 48,75 | Интервал | 25,94 |
Минимум | 7,42 | Минимум | 107,94 | Минимум | 55,98 |
Максимум | 57,13 | Максимум | 156,69 | Максимум | 81,92 |
Сумма | 772,37 | Сумма | 2651,57 | Сумма | 1404,98 |
Счет | Счет | Счет | |||
Уровень надежности(95,0%) | 7,4305516 | Уровень надежности(95,0%) | 6,900176 | Уровень надежности(95,0%) | 4,29605908 |
Определяем уровень варьирования признаков:
где
σx1 – стандартное отклонение по x1,
σx2 – стандартное отклонение по x2,
σy – стандартное отклонение по y,
,, - среднее арифметическое квадратов отклонений по x1 , по x2 , по y соответственно.
Приходим к выводу о неумеренном уровне варьирования признаков, превышающем 35% (т.е. совокупность данных по предприятиям не однородна), и возможности применения метода наименьших квадратов (МНК) для их изучения.
Анализ линейных коэффициентов парной корреляции
Матрицу парных коэффициентов корреляции переменных можно получить, используя инструмент анализа данных Корреляция.
Рисунок 2. Окно для ввода исходных данных
y | x1 | x2 | |
y | |||
x1 | 0,670366739 | ||
x2 | -0,269844097 | -0,481027741 |
Рисунок 3. Коэффициенты парной корреляции
Вывод: Из анализа коэффициентов парной корреляции следует, что значение ryx1=0,670366739 указывает на слабую прямую связь между y и x1, значение rx2x1=-0,481027741 говорит о слабой обратной связи между x2 и x1, а значение ryx2=-0,269844097 - о слабой обратной связи между y и x2.
Расчет коэффициентов частной корреляции
Линейные коэффициенты частной корреляции можно рассчитать по рекуррентной формуле через коэффициенты парной корреляции
Вывод: Из анализа частных коэффициентов множественной корреляции следует, что значение ryx1/x2= (x2 фиксируем) указывает на слабую связь между y и x1, а значение ryx2/x1=
(x1 фиксируем) говорит о слабой связи между x2 и y. В связи с этим, для улучшения данной модели можно исключить из неё фактор x2, как малоинформативный, недостаточно статистически надёжный.
Вычисление методом стандартизации переменных
Для вычисления коэффициентов множественной регрессии применим метод стандартизации переменных и построим искомое уравнения в стандартизованном масштабе
Расчёт β-коэффициентов выполняется по формулам:
0,70329896
0,06846221
Уравнение в стандартизованном масштабе:
Для построения уравнения в естественной форме рассчитаем b1 и b2, используя формулы перехода;
0,75735740
0,11841365
Значение a определим из соотношения:
Уравнение множественной регрессии:
Вывод: В данном примере статистически значимыми является a, а b1 и величина b2 сформировались под воздействием случайных причин, поэтому фактор x2 и x1, силу влияния которого оценивают b2 и b1, можно исключить как несущественно влияющие, неинформативные.