Линейная регрессия. Пример решения задачи
Исследовать характер зависимости двух изучаемых величин X и Y, числовые значения которых приведены в табл. 1.4.
Таблица 1.4
Исходные данные к задаче
Х | 9.0 | 7.9 | 5.6 | 6.1 | 4.5 | 5.9 | 4.2 | 4.1 | 3.3 | 3.7 |
Y | 104.0 | 99.6 | 95.4 | 83.0 | 86.5 | 81.5 | 79.0 | 77.3 | 65.6 | 58.0 |
Расчет коэффициентов уравнения регрессии
Подготовка данных для расчета коэффициентов уравнения регрессии приведена в табл. 1.5.
Таблица 1.5
Данные для расчета коэффициентов уравнения регрессии.
Х | Y | XY | X*X | Yт | (Yт-Yср) | (Y-Yт) | (Yт-Yср)^2 | (Y-Yт)^2 | |
3,30 | 65,60 | 216,48 | 10,89 | 68,5894 | -14,40 | -2,99 | 207,37804 | 8,9364 | |
3,70 | 58,00 | 214,6 | 13,69 | 71,2686 | -11,72 | -13,27 | 137,39216 | 176,05 | |
4,20 | 79,00 | 331,8 | 17,64 | 74,6175 | -8,37 | 4,38 | 70,098041 | 19,206 | |
4,30 | 77,30 | 332,39 | 18,49 | 75,2873 | -7,70 | 2,01 | 59,330982 | 4,0508 | |
4,50 | 86,50 | 389,25 | 20,25 | 76,6269 | -6,36 | 9,87 | 40,488628 | 97,477 | |
5,60 | 95,40 | 534,24 | 31,36 | 83,9947 | 1,00 | 11,41 | 1,0094118 | 130,08 | |
5,90 | 81,50 | 480,85 | 34,81 | 86,0041 | 3,01 | -4,50 | 9,0847061 | 20,287 | |
6,10 | 83,00 | 506,3 | 37,21 | 87,3437 | 4,35 | -4,34 | 18,95451 | 18,868 | |
7,90 | 99,60 | 786,84 | 62,41 | 99,4 | 16,41 | 0,20 | 269,28863 | 0,04 | |
9,00 | 104,00 | 106,768 | 23,78 | -2,77 | 565,38276 | 7,6606 | |||
Среднее | 5,45 | 82,99 | 472,88 | 32,78 | 82,99 | сумма | 1378,4079 | 482,66 | |
Дисперсия Диспра | 3,0725 | 186,11 | |||||||
СКО | 1,7529 | 13,642 |
Коэффициенты уравнения регрессии:
=(472,88-5,45*82,99)/(32,78-5,452)=6,6979
= 82, 99-6,6979*5,45=46,486
Расчет коэффициентов корреляции и детерминации
Коэффициент корреляции
= (472,88-5,45*82,99)/(1,7529*13,642)=0,8606
Коэффициент детерминации =(6,6979*1,7529) 2/13,6422=0,740654
Проверка значимости уравнения регрессии
Объясненная дисперсия на 1 степень свободы:
=1378,4079/482,66=1378,41
Остаточная дисперсия на 1 степень свободы:
=472,66/(10-2)=60,3326
Фактическое значение критерия Фишера: Fф=1378,41/60,3326=22,8468
Табличное значение критерия Фишера (для уровня значимости=0,05 и числа степеней свободы f1=1 и f2=8): Fт=5,32
Соотношение фактического и табличного значений критерия Фишера
Fф > Fт, поэтому уравнение регрессии значимо.
Границы доверительных интервалов
коэффициентов уравнения регрессии
Подготовка данных показана в табл. 1.6.
Таблица 1.6
Подготовка данных для вычисления границ доверительного интервала
Х | Х*Х | Х-Хср | (Х-Хср)^2 | ||
3,30 | 10,89 | -2,15 | 4,6225 | ||
3,70 | 13,69 | -1,75 | 3,0625 | ||
4,20 | 17,64 | -1,25 | 1,5625 | ||
4,30 | 18,49 | -1,15 | 1,3225 | ||
4,50 | 20,25 | -0,95 | 0,9025 | ||
5,60 | 31,36 | 0,15 | 0,0225 | ||
5,90 | 34,81 | 0,45 | 0,2025 | ||
6,10 | 37,21 | 0,65 | 0,4225 | ||
7,90 | 62,41 | 2,45 | 6,0025 | ||
9,00 | 3,55 | 12,6025 | |||
Среднее = | 5,45 | Сумма= | 327,8 | Сумма= | 30,725 |
Стандартные ошибки коэффициентов А, В и :
= = 1,401
= =8,02
= =0,18
Фактические значения t-критерия Стьюдента:
= 6,6979/1,401=4,781
=46,486/8,02=5,796
= 0,8606/0,18=4,781
Табличное значение значения t-критерия Стьюдента при числе степеней свободы n-2=8 и уровне значимости
q=1% t=2,3
q=5% t=3,35
Табличные значения критерия Стьюдента меньше фактических значений, поэтому все проверяемые коэффициенты значимы.
Границы доверительных интервалов коэффициентов:
отклонения от середины интервала: DА=1,401*2,3=3,22
DВ=8,02*2,3= 18,446
Dr =0,18*2,3=0,414
значения коэффициентов: А=6,6979 ± 3,22
В=46,486±18,446
rxy=0,86067±0,414
Учитывая соотношение оценок коэффициентов и их отклонений, следует принять:
А=6,7 ± 3,2
В=46,5±18,4
rxy=0,86±0,41.
Контрольные вопросы:
1. Что такое парная корреляция и линейная регрессия?
2. В каком виде существует уравнение линейной регрессии при парной корреляции?
3. Дайте определение коэффициентов регрессии, линейного коэффициента корреляции, эластичности.
4. В чем заключается сущность метода наименьших квадратов? Как определить коэффициенты регрессии по методу наименьших квадратов?
5. Что такое объясненная и остаточная дисперсии?
6. Что такое нулевая гипотеза и ошибки первого и второго рода?
7. Как проверяется значимость уравнения регрессии?
8. Что такое уровень значимости и мощность критерия?
9. Что такое число степеней свободы переменной величины?
10. Что такое доверительный интервал и как определяются границы доверительных интервалов коэффициентов регрессии и корреляции?
11. Как определяется фактическое и табличное значения критериев Фишера и Стьюдента?
12. Напишите формулы для подсчета коэффициентов регрессии, линейной корреляции и детерминации для случая линейной регрессии при парной корреляции.
Задания для самостоятельного решения
Задача. Построить модель связи между указанными факторами (табл. 1.7 и табл. 1.8), проверить ее адекватность, значимость коэффициентов уравнения регрессии и определить границы их доверительных интервалов. Исходные данные к задаче приведены в табл. 1.7, 1.8.
Таблица 1.7
Вар. | А | Б | В | Г | Д | Е | Ж | З | И | К |
2.0 | 2.3 | 2.1 | 2.4 | 2.9 | 3.3 | 3.8 | 4.6 | 5.1 | 5.4 | |
12.2 | 14.3 | 17.0 | 16.5 | 20.3 | 19.4 | 22.5 | 26.9 | 30.3 | 29.2 | |
4.0 | 5.5. | 7.2 | 7.0 | 8.2 | 10.4 | 10.1 | 8.8. | 11.3 | 14.0 | |
12.5 | 11.1 | 9.0 | 7.9 | 8.5 | 5.6 | 5.0 | 6.2 | 4.7 | 3.0 | |
2.3 | 2.5 | 2.0 | 2.9 | 3.3 | 3.8 | 5.0 | 4.0 | 7.4 | 7.5 | |
2.1 | 2.9 | 3.3 | 3.8 | 4.2 | 3.9 | 5.0 | 4.9 | 6.3 | 5.8 | |
11.1 | 9.0 | 7.9 | 5.6 | 6.1 | 4.5 | 5.9 | 4.2 | 4.1 | 3.3 | |
5.9 | 7.2 | 11.0 | 10.5 | 12.6 | 14.8 | 15.0 | 16.0 | 18.9 | 17.2 | |
19.1 | 20.7 | 20.2 | 22.8 | 22.8 | 27.4 | 24.7 | 30.2 | 33.4 | 31.0 | |
2.3 | 2.1 | 2.9 | 3.3 | 3.8 | 5.0 | 4.8 | 6.7 | 6.8 | 6.2 | |
17.0 | 17.3 | 18.6 | 19.1 | 20.7 | 20.0 | 22.3 | 25.0 | 27.3 | 36.8 | |
14.3 | 13.5 | 17.0 | 16.5 | 20.3 | 21.9 | 19.4 | 24.5 | 28.9 | 30.0 | |
9.5 | 10.3 | 7.9 | 5.6 | 6.1 | 4.2 | 6.8 | 3.5 | 3.2 | 2.0 | |
18.6 | 19.1 | 20.7 | 20.2 | 22.3 | 25.8 | 27.2 | 24.0 | 29.4 | 33.1 | |
1.0 | 2.3 | 2.1 | 2.9 | 3.3 | 4.4 | 5.3 | 7.9 | 6.2 | 9.0 | |
5.5 | 7.2 | 7.0 | 8.2 | 10.4 | 8.8 | 11.3 | 14.0 | 12.7 | ||
11.1 | 9.0 | 7.9 | 8.5 | 5.6 | 5.0 | 6.2 | 4.7 | 3.0 | 3.7 | |
2.5 | 2.0 | 2.9 | 3.3 | 3.8 | 5.0 | 4.0 | 7.4 | 7.5 | 6.9 | |
2.9 | 3.3 | 3.8 | 4.2 | 3.9 | 5.0 | 4.9 | 6.3 | 5.8 | 7.4 | |
9.0 | 7.9 | 5.6 | 6.1 | 4.5 | 5.9 | 4.2 | 4.1 | 3.3 | 3.7 |
Значения ряда Х
Таблица 1.8
Значения рядаY
Вар. | А | Б | В | Г | Д | Е | Ж | З | И | К |
14.3 | 18.6 | 20.9 | 18.7 | 24.2 | 22.3 | 25.7 | 27.0 | 32.2 | 31.0 | |
112.0 | 104.3 | 99.6 | 95.4 | 83.0 | 70.0 | 75.7 | 72.2 | 69.5 | 66.0 | |
18.6 | 19.1 | 20.7 | 20.2 | 22.3 | 25.4 | 30.2 | 29.6 | 35.7 | 34.0 | |
24.0 | 29.4 | 34.2 | 30.6 | 35.2 | 47.3 | 44.2 | 45.0 | 50.3 | 47.0 | |
9.1 | 10.7 | 10.2 | 12.3 | 12.8 | 8.4 | 12.3 | 15.0 | 16.3 | 15.5 | |
91.0 | 94.3 | 99.6 | 95.4 | 83.0 | 92.3 | 100.0 | 106.3 | 112.8 | 110.0 | |
34.2 | 30.6 | 35.2 | 40.7 | 43.5 | 48.3 | 49.6 | 53.5 | 50.5 | 54.0 | |
29.3 | 34.2 | 30.6 | 35.2 | 40.7 | 44.5 | 47.2 | 55.2 | 51.8 | 56.2 | |
64.5 | 70.2 | 79.3 | 74.6 | 81.4 | 83.0 | 88.2 | 83.5 | 94.2 | 99.0 | |
23.9 | 24.7 | 22.4 | 25.1 | 27.0 | 29.4 | 34.2 | 30.6 | 35.2 | 34.0 | |
33.8 | 30.6 | 37.8 | 40.2 | 41.5 | 44.3 | 50.0 | 60.2 | 58.3 | 62.6 | |
104.3 | 99.6 | 95.4 | 83.0 | 86.4 | 81.5 | 79.0 | 77.3 | 65.6 | 68.4 | |
68.3 | 64.5 | 70.2 | 79.3 | 82.6 | 101.4 | 96.2 | 95.5 | 109.2 | 105.0 | |
29.4 | 34.2 | 30.6 | 35.2 | 40.7 | 43.5 | 44.2 | 54.9 | 50.2 | 56.0 | |
57.8 | 68.3 | 64.5 | 70.2 | 79.3 | 80.5 | 75.3 | 89.0 | 91.2 | 90.2 | |
29.5 | 34.2 | 30.6 | 35.2 | 40.7 | 44.5 | 47.2 | 55.2 | 51.8 | 56.7 | |
66.0 | 70.2 | 79.3 | 74.6 | 81.4 | 83.0 | 88.2 | 83.5 | 94.2 | 87.3 | |
22.0 | 24.7 | 22.4 | 25.1 | 27.0 | 29.4 | 34.2 | 30.6 | 35.2 | 33.9 | |
28.0 | 30.6 | 37.8 | 40.2 | 41.5 | 44.3 | 50.0 | 60.2 | 58.3 | 64.0 | |
104.0 | 99.6 | 95.4 | 83.0 | 86.5 | 81.5 | 79.0 | 77.3 | 65.6 | 58.0 |