Тема 2: Множественная регрессия и корреляция




МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ

РОССИЙСКОЙ ФЕДЕРАЦИИ

ОРЛОВСКИЙ ГОСУДАРСТВЕННЫЙ ИНСТИТУТ

ЭКОНОМИКИ И ТОРГОВЛИ

С.В.Дёминова

 

 

Студента (ки) группы____________

 

 

ФИО______________________________

 

 

ОРЕЛ - 2012

Тема 1: Парная регрессия и корреляция

Задача 1.

Фирма провела рекламную кампанию. Через 10 недель фирма решила проанализировать эффективность этого вида рекламы, сопоставив недельные объёмы продаж с расходами на рекламу:

Номер региона Недельные объёмы продаж, тыс. руб. Расходы на рекламу, тыс. руб.
     
     
     
     
     
     
     
     
     
     

Задание:

1. Постройте линейное уравнение парной регрессии у от х.

2. Рассчитайте линейный коэффициент парной корреляции

3. Рассчитайте коэффициент детерминации.

4. Определите среднюю ошибку аппроксимации.

5. Оцените статистическую значимость параметров регрессии и корреляции.

6. С вероятностью 0,95 оцените доверительный интервал ожидаемой величины недельного объёма продаж компании с уровнем расходов на рекламу в 13 тыс. руб.

Решение:

1. Для расчета параметров уравнения линейной регрессии строим расчетную таблицу:

№п/п , (Аi%)
                     
                     
                     
                     
                     
                     
                     
                     
                     
                     
Итого                    

Рассчитаем промежуточные показатели:

Рассчитаем параметры уравнения:

Получено следующее уравнение регрессии:

Коэффициент регрессии показывает, что

 

2. Тесноту линейной связи оценивает коэффициент корреляции. Для его определения рассчитаем следующие показатели:

Дисперсию факторного признака :

Среднее квадратическое отклонение факторного признака

Дисперсию результативного признака

Среднее квадратическое отклонение результативного признака y

Далее рассчитаем коэффициент корреляции:

Так как rxy

 

3. Определим коэффициент детерминации:

D =

Он показывает, что вариация результативного признака на ….% зависит от ва­риации факторного признака

4. Качество модели оценим с помощью средней ошибки аппроксимации:

5. Оценку статистической значимости параметров регрессии проведем с помощью t-критерия Стьюдента.

Определим остаточную дисперсию:

Определим случайные ошибки параметров уравнения и коэффициента корреляции:

 

 

Определим расчетные значения t-критерия Стьюдента.

 

tтабл. при заданных степенях свободы df = n-2 = 10 – 2 = 8 и уровне значимости 5% (уровень надёжности 0,95 (95%)) составляет 2,306.

Сравним расчетные значения t-критерия Стьюдента с табличным:

6. Полученные оценки уравнения регрессии позволяют его использовать для прогнозирования. Предполагаемые расходы на рекламу на следующую неделю составят 13 тыс. руб., то есть = 13 тыс. руб.

 

Тогда прогнозное значение недельных объёмов продаж составит:

 

Ошибка прогноза составит:

Предельная ошибка прогноза, которая в 95% не будет превышена, составит следующую величину:

Построим доверительный интервал прогноза:

Выполненный прогноз показывает, что при уровне расходов на рекламу в 13 тыс. руб., недельный объём продаж фирмы будет находиться в пределах от …….. тыс. руб. до ……………. тыс. руб.

 

 

Задача 2. При исследовании корреляционной зависимости между ценой на нефть и индексом нефтяных компаний получены следующие данные:

=16,2 (ден. ед.), =4000 (усл. ед.), ( - * ) = 40, =4, =500.

Задание:

1) составьте уравнение регрессии;

2) используя полученное уравнение регрессии, найдите среднее значение индекса при цене на нефть 16,5 ден. ед.

Решение:

Задача 3. Имеются следующие данные по семи территориям Уральского района

Район Расходы на покупку продо­воль­ственных товаров, % Среднедневная заработная плата одного рабочего, у.е.
Удмуртия 68,8 45,1
Свердловская обл. 61,2  
Башкортостан 59,9 57,2
Челябинская обл. 56,7 61,8
Пермская обл.   58,8
Курганская обл. 54,3 47,2
Оренбургская обл. 49,3 55,2

Задание:

1) для характеристики зависимости определите параметры функ­ции равносторонней гиперболы

2) оцените полученную модель через среднюю ошибку аппроксимации и - критерий Фишера.

Решение:

1)уравнение равносторонней гиперболы

приводится к линейному виду при замене , тогда получим следующее уравнение:

В соответствии с методом наименьших квадратов, параметры уравнения определяются по следующим формулам:

 

zy , (Аi%)
                   
                   
                   
                   
                   
                   
                   
                 

1)

 

Определим дисперсию

Определим параметры уравнения

Уравнение регрессии имеет следующий вид:

 

2) Определим среднюю ошибку аппроксимации

Оценим тесноту связи с помощью индекса корреляции

Оценим статистическую значимость уравнения регрессии с помощью - критерия Фишера:

факт

табл. при заданных степенях свободы и уровне значимости составляет 6,61.

 

Таким образом,

 

 

Задача 4. Зависимость среднемесячной производительности труда о возраста рабочих характеризуется моделью: . Ее использование привело к следующим результатам:

№ п/п Производительность труда рабочих, тыс.руб. № п/п Производительность труда рабочих, тыс.руб.,
фактическая расчетная фактическая расчетная
           
           
           
           
           

Задание: Оцените качество модели, определив ошибку аппроксимации, индекс корреляции и F-критерий Фишера.

Решение: построим расчетную таблицу:

№ п/п
     
     
     
     
     
     
     
     
     
     

факт

табл.=5,32

Задача 5. По группе предприятий, производящих однородную продукцию, известно, как зависит себестоимость единицы продукции у от факторов:

Признак - фактор Уравнение парной регрессии Среднее значение фактора
Объем производства млн.руб., х1
Трудоемкость единицы продукции, чел.-час., х2
     
     

 

Задание: Определите с помощью коэффициентов эластичности силу влияния каждого фактора на результат.

Решение:

Для уравнения равносторонней гиперболы :

Для уравнения прямой :

Задача 5. По территории центрального района известны следующие данные

Район Доля денежных доходов, направленных на сбережения, % Среднемесячная заработная плата, у.е.
Брянская обл. 6,9  
Владимирская обл. 8,7  
Ивановская обл. 3,4  
Калужская обл. 8,4  
Костромская обл. 6,1  
Орловская обл. 9,4  
Рязанская обл. 11,0  
Смоленская обл. 6,4  
Тверская обл. 9,3  
Тульская обл. 8,2  
Ярославская обл. 8,6  

Задание:

1. Постройте линейное уравнение парной регрессии у от х.

2. Рассчитайте линейный коэффициент парной корреляции

3. Рассчитайте коэффициент детерминации.

4. Определите среднюю ошибку аппроксимации.

5. Оцените статистическую значимость параметров регрессии и корреляции (tтабл.)=2,26.

6. С вероятностью 0,95 оцените доверительный интервал ожидаемой доли денежных доходов, направленных на сбережения с уровнем среднемесячной заработной платы в 392 у.е.

 

Тема 2: Множественная регрессия и корреляция

Задача 1. Имеются следующие данные по торговым предприятиям:

Валовой доход за год, млн. руб. Среднегодовая стои­мость основных фон­дов, млн. руб. Среднегодовая стоимость оборотных фондов, млн. руб.
  20,3 11,8 10,5
  6,3 2,8 5,6
  4,5 1,7 5,4
  11,3   6,3
  12,1 5,6 2,8
  8,8 10,2  
    11,6 5,4
  5,6 12,4 4,2
    11,4 3,6
  23,7 15,4 10,6
    11,5 8,8
  7,5 9,8 4,6

Задание:

1) определите параметры уравнения линейной множественной регрессии;

2) оцените тесноту связи изучаемых показателей;

3) оцените значимость полученного уравнения.

 

Решение:

1) Для определения параметров уравнения линейной множественной регрессии:

построим следующую систему уравнений:

 

Построим расчетную таблицу

x1 x2 y yx1 yx2 x21 x22 x1x2
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
итого                

 

Решим систему методом определителей матрицы

 

Рассчитаем частные определители путем замены соответствующего столбца матрицы данными левой части системы

=

 

 

 

 

       
   


 

 

Определим параметры уравнения по следующим формулам:

Уравнение линейной множественной регрессии имеет следующий вид:

 

Коэффициенты регрессии показывают, что

 

2) Оценим тесноту связи с помощью индекса множественной корреляции

 

 

Построим расчетную таблицу

x1 x2 y yxi
             
             
             
             
             
             
             
             
             
             
             
             
итого            

3) оценим статистическую значимость уравнения регрессии в целом

 

F табл. = 4,26 при заданных степенях свободы и уровне значимости (5%).

 

Задача 1. По 30 территориям России имеются следующие данные:

Признак Среднее значение Среднее квадратическое отклонение Линейный коэффициент парной корреляции
Среднедневной душевой доход, руб., у 86,8 11,44 -
Среднедневная заработная плата одного работающего, руб., х 1 54,9 5,86
Средний возраст безработного, лет, х 2 33,5 0,58

Задание:

1)постройте уравнение множественной регрессии в стандартизованной и естественной форме; рассчитать частные коэффициенты эластичности, сравнить их с и , пояснить различия между ними.

2) рассчитайте линейные коэффициенты частной корреляции и коэффициент множественной корреляции, сравнить их с линейными коэффициентами парной корреляции, пояснить различия между ними.

3) рассчитайте общий и частные F- критерии Фишера.

Решение:

1. Линейное уравнение множественной регрессии y от x 1 и x 2 имеет вид: . Для расчёта его параметров применим метод стандартизации переменных и построим искомое уравнение в стандартизованном масштабе: .

Расчёт -коэффициентов выполним по формулам

Получим уравнение

.

Для построения уравнения в естественной форме рассчитаем b 1 и b 2 используя формулы для перехода от к bi:

;

Значение а0 определим из соотношения

тогда

 

Для характеристики относительной силы влияния x 1 и x 2 на y рассчитаем средние коэффициенты эластичности:

С увеличением средней заработной платы x 1 на 1% от ёё среднего уровня средний душевой доход у возрастает на ……..% от своего среднего уровня; при повышении среднего возраста безработного x 2 на …….% среднедушевой доход у снижается на ……..% от своего среднего уровня. Сила влияния средней заработной платы x 1 на средний душевой доход у оказалась ………, чем сила влияния среднего возраста безработного x 2.

Сравним модули значений β1 и β2:

Различия в силе влияния фактора на результат, полученные при сравнении и βj, объясняются тем, что коэффициент эластичности исходит из соотношения средних: , а β-коэффициент - из соотношения средних квадратических отклонений: .

 

2. Линейные коэффициенты частной корреляции здесь рассчитываются по рекуррентной формуле:

Если сравнить значения коэффициентов парной и частной корреляции, то приходим к выводу, что из-за слабой межфакторной связи коэффициенты парной и частной корреляции отличаются …………………………………….............................................................................

…………………………………………………………………………………………………….., то есть

 

Расчет линейного коэффициента множественной корреляции выполним с использованием коэффициентов и βj:

Зависимость y от x 1 и x 2 характеризуется как …………., в которой …….% вариации среднего душевого дохода определяются вариацией учтенных в модели факторов: средней заработной платы и среднего возраста безработного. Прочие факторы, не включенные в модель, составляют соответственно ………..% от общей вариации у.

 

3.Общий F- критерий проверяет гипотезу H 0 о статистической значимости уравнения регрессии и показателя тесноты связи (R 2 =0):

Сравнивая и , приходим к выводу о необходимости ………… гипотезу H 0, так как …… . С вероятностью 1-α=0,95 делаем заключение о статистической …………….. уравнения в целом и показателя тесноты связи , которые сформировались под …………………… воздействием факторов x 1 и x 2.

Частные F- критерии - и оценивают статистическую значимость присутствия факторов x 1 и x 2 в уравнении множественной регрессии, оценивают целесообразность включения в уравнение единого фактора после другого фактора, т.е. оценивает целесообразность включения в уравнение фактора x 1 после того, как в него был включен фактор x 2. Соответственно указывает на целесообразность включения в модель фактора x 2 после фактора x 1:

Сравнивая и , приходит к выводу о ………………. включения в модель фактора x 1 после фактора x 2, так как Гипотезу H 0 о несущественности прироста за счет включения дополнительного фактора x 1 после фактора x 2………………..

Целесообразность включения в модель фактора x 2 после фактора x 1 проверяет

Значение свидетельствует о статистической ………….. прироста за счет включения в модель фактора x 2 после фактора x 1. Следовательно, ……………… нулевая гипотеза H 0 о нецелесообразности включения в модель фактора x 2 (средний возраст безработного). Это означает, что парная регрессионная модель зависимости среднего дохода от средней заработной платы является статистически ………………., ………………….. и что ……………………………………, включая дополнительный фактор x 2 (средний возраст безработного).

 

Задача 3. Имеются следующие данные по с/х предприятиям:

Посевная площадь, тыс. га Валовой сбор, тыс. т Внесено мин. удобрений, кг/га
       
    4,6  
  3,1 4,4  
  3,2 4,5  
  3,4 5,5  
  3,5 4,8  
  3,7 5,1  
  3,2 5,2  
  3,9    
  3,5 5,3  
    7,5  
  3,7 7,7  
    7,3  
  3,8    
    6,7  

Задание:

1) охарактеризуйте зависимость представленных показателей;

2) постройте уравнение множественной регрессии и определите его параметры;

3) оцените тесноту связи изучаемых показателей;

4) оцените значимость уравнения множественной регрессии (самостоятельно).



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-04-27 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: