Задание 1.
Решение:
Построим поле корреляции.
Рисунок 1. Поле корреляции.
Анализируя расположение точек поля корреляции, предполагаем, что связь между признаками х и у может быть линейной, т.е. .
Рассчитаем параметры линейной регрессии методом наименьших квадратов.
№ | ||||||||||
-1 | 0,5 | -0,5 | 0,25 | 0,452 | 0,048 | 0,002 | 0,095 | 2,0079 | ||
1,5 | 2,25 | 1,038 | 0,462 | 0,213 | 0,308 | 0,1739 | ||||
1,624 | -0,624 | 0,389 | 0,624 | 0,8409 | ||||||
2,210 | -0,210 | 0,044 | 0,105 | 0,0069 | ||||||
2,795 | 0,205 | 0,042 | 0,068 | 1,1729 | ||||||
3,5 | 12,25 | 3,381 | 0,119 | 0,014 | 0,034 | 2,5059 | ||||
Сумма | 11,5 | 27,5 | 28,75 | 0,705 | 1,234 | 6,7083 | ||||
Среднее | 1,5 | 1,917 | 4,583 | 5,167 | 4,792 | - | - | - | - | - |
Уравнение линии регрессии для линейной зависимости имеет вид , коэффициенты a и b находятся из системы уравнений:
Подставив полученные значения в систему, получаем:
Решив систему, получим . Следовательно, уравнение линии регрессии:
С увеличением X на 1 ед., Y в среднем увеличиться на 1,0381 ед.
Тесноту связи оценим с помощью линейного коэффициента парной корреляции. Предварительно определим средние квадратические отклонения признаков.
Откуда коэффициент корреляции:
Между признаками X и Y наблюдается очень высокая, прямая линейная корреляционная связь.
Определим среднюю относительную ошибку Аппроксимации:
Ошибка небольшая. Качество модели высокое.
Коэффициент детерминации:
Это означает, что Y на 89.49% зависит от X. Остальные 10,51% припадают на стохастическую компоненту та на факторы, которые не включены в модель.
Примем α = 0,05. Найдем табличное (критическое) значение F- критерия Фишера:
Найдем фактическое значение F - критерия Фишера:
Так как
Рассчитаем прогнозное значение. Точечный прогноз:
Вывод: анализируя расположение точек поля корреляции, было предположено, что связь между признаками х и у может быть линейной, т.е. .
Методом наименьших квадратов было найдено следующее уравнение, описывающее зависимость:
С увеличением X на 1 ед., Y в среднем увеличиться на 1,0381 ед.
Между признаками X и Y была установлена очень высокая, прямая линейная корреляционная связь. Y на 89.49% зависит от X. Остальные 10,51% припадают на стохастическую компоненту та на факторы, которые не включены в модель.
При увеличении среднего уровня на 110% величина У будет на уровне 2,0045.
Рассчитаем параметры квадратичной регрессии методом наименьших квадратов.
№ | ||||||||
-1 | 0,5 | -0,5 | 0,25 | -1 | 0,5 | |||
1,5 | 2,25 | |||||||
3,5 | 12,25 | |||||||
Всего | 11,5 | 27,5 | 28,75 | 92,5 | ||||
Сред. | 1,5 | 1,9174 | - | - | - | - | - | - |
№ | ||||||
-1 | 0,5 | 0,661 | 0.0258 | 0.321 | 2,0079 | |
1,5 | 0,996 | 0.254 | 0.336 | 0,1739 | ||
1,457 | 0.209 | 0.457 | 0,8409 | |||
2,043 | 0.00184 | 0.0214 | 0,0069 | |||
2,754 | 0.0607 | 0.0821 | 1,1729 | |||
3,5 | 3,589 | 0.00797 | 0.0255 | 2,5059 | ||
Всего | 11,5 | 11,5 | 0.559 | 1.243 | 6,7083 |
Уравнение линии регрессии для линейной зависимости имеет вид , коэффициенты находятся из системы уравнений:
Подставив полученные значения в систему, получаем:
Решим систему методом Крамера.
Найдем определитель основной матрицы:
, то заданая за теоремой Крамера СЛАУ имеет единое решение.
Найдем определители полученные из определителя , заменой соответствующего 1-ого, 2-ого, 3-ого столбика столбиком свободных переменных:
,
,
.
За формулой Крамера:
Получим . Следовательно, уравнение линии регрессии:
Индекс корреляции:
Между признаками X и Y наблюдается очень высокая линейная корреляционная связь.
Определим среднюю относительную ошибку Аппроксимации:
Ошибка большая. Качество модели низкое.
Коэффициент детерминации:
Это означает, что Y на 91.67% зависит от X. Остальные 8,33% припадают на стохастическую компоненту та на факторы, которые не включены в модель.
Примем α = 0,05. Найдем табличное (критическое) значение F- критерия Фишера:
Найдем фактическое значение F - критерия Фишера:
Так как
Рассчитаем прогнозное значение. Точечный прогноз:
Вывод: Методом наименьших квадратов было найдено следующее квадратное уравнение, описывающее зависимость:
Между признаками X и Y была установлена очень высокая линейная корреляционная связь. Y на 91.67% зависит от X. Остальные 8,33% припадают на стохастическую компоненту та на факторы, которые не включены в модель.
При увеличении среднего уровня на 110% величина У будет на уровне 1,8229.
Уровень качества квадратной регрессии немного выше, чем линейной.