Задание 1. Определить зависимость ввода в действие жилых домов от инвестиции в жилищное строительство по регионам РК. Оцените значимость уравнения регрессии и его параметров.
Таблица 5 – Данные для построения уравнения линейной регрессии
| № | Области | Инвестиции, млн.тг, х | Введено, тыс.кв.м., у | (х-хср) | (у-уср) | ỹ | у-ỹ | Аi |
| Акмола | 16,04 | |||||||
| Актобе | 43,37 | |||||||
| Алматы | 75,09 | |||||||
| Атырау | 54,94 | |||||||
| Восточный Казакстан | 25,36 | |||||||
| Жамбыл | 27,36 | |||||||
| Западный Казакстан | 33,73 | |||||||
| Караганды | 9,83 | |||||||
| Костанай | 14,70 | |||||||
| Кызылорда | 21,79 | |||||||
| Мангыстау | 45,77 | |||||||
| Павлодар | 11,65 | |||||||
| Северный Казакстан | 3,07 | |||||||
| Южный Казакстан | 73,85 | |||||||
| Среднее | ||||||||
| σ2 | ||||||||
| r | ||||||||
| R2 | ||||||||
| a | ||||||||
| b |
Требуется:
1. Построить линейное уравнение парной регрессии у от x, определяющее зависимость ввода в действие жилых домов от инвестиции в жилищное строительство.
2. На основе исходных и расчетных значений построить корреляционное поле и тренд уравнения линейной регрессии.
3. Рассчитать линейный коэффициент парной корреляции, коэффициент детерминации.
4. Оценить адекватность модели. Средняя ошибка аппроксимации и коэффициент эластичности.
5. Оценить статистическую значимость параметров регрессии и корреляции.
6. Выполнить прогноз ввода жилья y при прогнозном среднем значении инвестиции x на 20%, Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
7. Добавить в график уравнения линейной регрессии прогнозное значение результативного признака y.
8. С помощью пакета анализа данных (Сервис–Анализ данных–Регрессия) получить параметры линейной регрессии, корреляции, доверительные интервалы, т.е. вывести итоги по регрессионной статистике, дисперсионному анализу и выводу остатков.
Решение:
1. Построить линейное уравнение парной регрессии методом наименьших квадратов.
Используя расчетные формулы:

получить уравнение регрессии: ỹ = 16,65 + 0,055 • х.
Вывод: С увеличением инвестиции в строительство жилья на 1млн.тенге ввод жилья незначительно возрастет в среднем на 0,055 кв.м.
3. На диаграмме корреляционного поля зависимости переменных х, у построить ряд точек, используя расчетные значения
и линию линейного тренда.

Рисунок 5 – Тренд уравнения линейной регрессии у = 16,65 + 0,055 • х
3. Рассчитать линейный коэффициент парной корреляции и коэффициент детерминации.

Вывод: Связь прямая положительная. Коэффициент детерминации показывает, что 64% вариации ввода жилья (у) объясняется вариацией инвестиции в строительство х.
4. Оценить качество уравнения регрессии в целом с помощью F-критерия Фишера. Если F< Fтаб, то R2 незначим; если F> Fтаб, то R2 значим.
Фактическое значение F-критерия: 
сравнивается с табличным значением Fтабл=4,75 из таблицы F-критерия Фишера.
Вывод: Уравнение регрессии значимо при уровне значимости α = 0,05.
5. Оценку адекватности модели определить средней ошибкой аппроксимации:

Рассчитать коэффициент эластичности: 
Показатель эластичности свидетельствует об увеличении на 0,49% ввода кв.м. жилья при увеличении на 1% инвестиции в строительство.
6. Оценку статистической значимости параметров регрессии провести с помощью t-статистики Стьюдента.
Выдвигается основная гипотеза о статистически незначимых показателей
Но: a=b=0.
Определить среднеквадратические отклонения Sa, Sb параметров а и b от своих оценок:
Рассчитать фактические значения t-статистики:
Для числа степеней свободы df=n-2=12 и α=0 tтабл=2,178.
Если tфакт>tтабл, то гипотеза Но отклоняется, т.е. a, b не случайно отличаются от нуля и статистически значимы.
Определить предельную ошибку для каждого показателя:

Доверительные интервалы рассчитать с помощью следующих формул:

Витоге получить аÎ[5.3; 28.0] и b Î[0.03; 0.08]
Вывод: Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью р = 1-a = 0,95, где a=0,05, параметры а и b, находясь в указанных границах, не принимают нулевых значений, т.е. не являются статистически незначимыми и существенно отличны от нуля.
7. Выполнить прогноз ввода жилья у при прогнозном среднем значении инвестиции х на 20%. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
Если прогнозное значение инвестиции составит:
, то прогнозное значение ввода жилья составит: 
Среднеквадратичное отклонение (ошибка) прогноза:

Предельная ошибка прогноза, которая в 95% случаевне будет превышена, составит: 
Доверительный интервал прогноза
: [3,09; 68,51]
Добавить в график уравнения линейной регрессии прогнозное значение результативного признака у.
Рисунок 6 – Прогнозное значение на основе линейного уравнения регрессии
8. Вывести итоги по регрессионной статистике, дисперсионному анализу и выводу остатков с помощью команды Сервис–Анализ данных–Регрессия. Получить параметры линейной регрессии, корреляции, доверительные интервалы и остатки.
Задание 2. По данным проведенного опроса восьми групп семей известны данные связи расходов населения на продукты питания с уровнем доходов семьи. Оцените значимость построенного уравнения регрессии и его параметров.
Таблица 6 – Данные для построения уравнения линейной регрессии
| № | Доходы семьи, тыс.тг, х | Расходы на питание, тыс.тг, у | (х-хср) | (у-уср) | ỹ | у-ỹ | Аi |
| 1,2 | 0,9 | ||||||
| 3,1 | 1,2 | ||||||
| 5,3 | 1,8 | ||||||
| 7,4 | 2,2 | ||||||
| 9,6 | 2,6 | ||||||
| 11,8 | 2,9 | ||||||
| 14,5 | 3,3 | ||||||
| 18,7 | 3,8 | ||||||
| Среднее | |||||||
| σ | |||||||
| r | |||||||
| R2 | |||||||
| a | |||||||
| b |
Требуется:
1. Предположим, что связь между доходами семьи и расходами на питание линейная. Построить корреляционное поле.

Рисунок 7 – Корреляционное поле зависимости
2. Расчитать параметры линейного уравнения парной регрессии
и получить уравнение 
3. Рассчитать линейный коэффициент парной корреляции и коэффициент детерминации
4. Оценить качество уравнения регрессии в целом с помощью F-критерия Фишера. Табличное значение Fтабл =4,75 при k1=1, k2=n-2=6, α = 0,05.
Если F> Fтаб, то уравнение регрессии значимо в целом
5. Качество уравнения регрессии определить средней ошибкой аппроксимации.
6. Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитать t- критерий Стьюдента и доверительные интервалы параметров.
Фактические значения t- статистик:
tтабл=2,447 для числа степеней свободы df=n-2=6 и α=0,05.
Для tфакт>tтабл a, b, r статистически значимы.
Рассчитать доверительный интервал для а и b:

В итоге получить: аÎ[0,597; 1,075] и b Î[0,145; 0,191]
7. Найти прогнозное значение результата при значении фактора, составляющем 110% от среднего уровня. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
Если прогнозное значение доходов семьи:
,
то прогнозное значение расходов на питание составит:
Ошибка прогноза: 
Предельная ошибка прогноза, которая в 95% случаевне будет превышена, составит: 
Вывод: Доверительный интервал прогноза [2,113; 2,867] является статистически надежным.
8. Добавить в график корреляционного поля тренд уравнения линейной регрессии и прогнозное значение результативного признака у.
9. Проверить параметры линейной регрессии, корреляции с помощью пакета Анализ данных командой Сервис– Анализ данных–Регрессия.