Простая объединенная регрессия




Содержание

 

1. Справка из экономической теории……………………………………………3

2. Описание переменных………………………………………………………....4

3. Описательные статистики……………………………………………………..5

4. Простая объединенная регрессия…………………………………………….11

5. Модель с фиксированным эффектом………………………………………..13

6. Модель со случайным эффектом…………………………………………….15

7. Модель в среднем…………………………………………………………….17

Вывод……………………………………………………………………………..18

 

 


Справка из экономической теории

 

Россия относится к странам с высоким уровнем потребления молочных продуктов. Российский рынок молочной продукции является составной частью российской пищевой промышленности. Пищевая промышленность играет огромную роль в экономике страны. В настоящее время российская пищевая промышленность объединяет в себе 25 тыс. предприятий. Молочная промышленность - крупная отрасль народного хозяйства. В общем объеме производства пищевых продуктов в РФ она занимает третье место.

Молочное животноводство характеризуется стабильностью за период 2000-2008 гг. В 2010 г. в «десятку» лидеров по производству молока в сельхозпредприятиях входили (в порядке убывания объемов производства): Республика Татарстан, Краснодарский край, Московская область, Алтайский край, Ленинградская область, Удмуртская Республика, Республика Башкортостан, Новосибирская, Кировская, Вологодская области.

Самая высокая доля производства молока уходит в сегмент цельномолочной продукции (питьевое молоко и питьевые кисломолочные продукты) - 70% сырого товарного молока. Остальные 30% сырого молока распределяются между производителями сыров, масла, сухого и концентрированного молока.

На данный момент на рынке молочной продукции лидируют отечественные компании-производители. Однако, наряду российскими гигантами, такими как «Вимм – Билль - Данн» и «Юнимилк», зарубежные имеют значительные бюджеты рекламной деятельности и инновационные производственные технологии, которые позволяют им предлагать на рынке высококачественную продукцию, продвигать ее и реализовывать через отлаженные системы сбыта.

Описание переменных

Для проведения эконометрического исследования производства молока использовались данные статистического ежегодника. Выборка сформирована по показателям 2007 - 2009 гг. Из выборки исключены показатели:

1. по областям: Магаданская, Сахалинская, Мурманская, Еврейская;

2. Чеченская республика, Чукотский автономный округ;

3. по городам: Москва, Санкт – Петербург.

Данные объекты исключены из-за отсутствия данных. Для объяснения объемов производства молока были отобраны показатели, представленные ниже.

Prit Производство молока (тыс. тонн);
Pogit Поголовье крупного рогатого скота(КРС) в хозяйствах всех категорий (тыс. голов);
VolSborit Валовый сбор зерна (тыс. тонн);
Nadoiit Надои молока на одну корову (кг);
Rashodit Расход кормов на одну корову (центнер);
Invit Инвестиции в основной капитал (млн. руб.);
Zanit Средняя численность занятых в экономике (тыс. чел.);
Potrit Потребление молока и молочных продуктов (кг);
Transit Перевозка грузов автомобильным транспортом организации (млн. тонн);
n Номер региона

 

 


Описательные статистики

Представим описательные статистики переменных.

Variable | Obs Mean Std. Dev. Min Max

----------+------------------------------------------------------------------

n | 216 36.5 20.83088 1 72

year | 216 8.8183932 7 9

pr | 216 443.8588 401.3753 14.9 2461.8

pog | 216 288.9963 274.9046 9.6 1765.6

volsbor | 216 1324.972 1917.331 0 11634.4

nadoi | 216 3483.509 1042.096 841 6738

rashod | 216 28.08519 4.773752 7.9 39.7

inv | 216 89004.89 123862.3 2396 1025474

zan | 216 99.81481 1.482695 95.5 105.1

potr | 216 240.0046 50.29961 138 368

trans | 216 33.18426 38.81215 1.2 241.4

Выборка содержит 216 наблюдений по 72 регионам за 3 года (2007 – 2009).

В среднем производство молока составляет 443,86 тыс. тонн. Минимальное значение 14,9 тыс. тонн, максимальное 2461,8 тыс. тонн. Разброс объемов производства молока значителен.

Численность поголовья крупного рогатого скота в среднем составляет 288,99 тыс. голов. Минимальное значение 9,6 тыс. голов, максимальное 1765,6 тыс. голов. Различия можно объяснить неодинаковым развитием отрасли в разных регионах.

Валовый сбор зерна в среднем составляет 1324,97 тыс. тонн, минимальное значение 0, максимальное – 11634,4 тыс. тонн. Разброс этого показателя значителен. Это можно объяснить неодинаковым развитием сельскохозяйственной отрасли в регионах, а так же климатическими условиями.

В среднем в регионе надои молока на одну корову составляет 3483,51 кг. Минимальное значение равно 841 кг, максимальное 6738 кг.

Расход кормов в расчете на одну условную голову КРС среднем составляет 28,09 центнеров, минимальное значение этого показателя 7,9 центнеров, максимальное – 39,7 центнеров.

Инвестиции в основной капитал в среднем составляют 89004,9 млн. руб. Минимальное значение инвестиций составляет 2396 млн. руб., максимальное – 1025474 млн. руб.

Численность занятых в экономике в среднем составляет 99,81 тыс. чел., минимальное количество – 95,5 тыс. чел., максимальное 105,1 тыс. чел.

Потребление молока и молочных продуктов в среднем составляет 240,004 кг в год, минимальное значение 138 кг, максимальное 368 кг.

Объем перевозок грузов автомобильным транспортом организации в среднем составляет 33,18 млн. тонн, минимальное значение равно 1,2 млн. тонн, максимальное – 241,4 млн. тонн.

Разброс показателей можно объяснить различиями в развитии сельскохозяйственной и транспортной отраслях, климатических условий, объема спроса регионов.

Построим корреляционную матрицу для выяснения характера зависимости между объемом производства молока и объясняющими факторами:

| pr pog volsbor nadoi rashod inv zan

-------------+---------------------------------------------------------------

pr | 1.0000

|

pog | 0.9141 1.0000

| 0.0000

|

volsbor | 0.6768 0.5617 1.0000

| 0.0000 0.0000

|

nadoi | 0.2999 0.0036 0.2391 1.0000

| 0.0000 0.9585 0.0004

|

rashod | 0.4127 0.2601 0.2162 0.3949 1.0000

| 0.0000 0.0001 0.0014 0.0000

|

inv | 0.3672 0.2435 0.2425 0.3526 0.1539 1.0000

| 0.0000 0.0003 0.0003 0.0000 0.0237

|

zan | 0.0002 0.0715 0.0419 -0.1575 -0.1929 0.1111 1.0000

| 0.9980 0.2955 0.5404 0.0206 0.0044 0.1035

|

potr | 0.5292 0.5301 0.2084 0.0698 0.2570 -0.0664 -0.0838

| 0.0000 0.0000 0.0021 0.3069 0.0001 0.3316 0.2201

|

trans | 0.4720 0.3450 0.3476 0.3620 0.1938 0.8339 0.1050

| 0.0000 0.0000 0.0000 0.0000 0.0043 0.0000 0.1238

|

| potr trans

-------------+------------------

potr | 1.0000

|

trans | -0.0608 1.0000

| 0.3741

 

Коэффициенты корреляции между переменными значимы. Сильная линейная связь существует между объемом производства молока и поголовьем КРС, а так же валовым сбором зерна.

Умеренная связь обнаруживается между объемом производства молока и расходом кормов, потреблением молока, а так же перевозкой и производством молока.

Слабая связь наблюдается между производством молока и численностью занятых в экономике, инвестициями в основной капитал и надоем молока.

Построим графики зависимостей между объясняемой и объясняющими переменными.

Рис. 1. Зависимость производства молока от поголовья КРС

 

Рис. 2. Зависимость страховых премий производства молока от валового сбора зерна

 

Рис. 3. Зависимость производства молока от надоя молока

 

Рис. 4. Зависимость производства молока от расхода кормов

 

Рис. 5. Зависимость производства молока от инвестиций в основной капитал

 

Рис. 6. Зависимость производства молока от численности занятых в экономике

 

Рис. 7. Зависимость производства молока от потребления

 

Рис. 8. Зависимость производства молока от перевозки грузов

 

На графиках видна линейная зависимость производства молока от объясняющих показателей.


Простая объединенная регрессия

Предположим, что у регионов нет индивидуальных различий. Для объяснения объема производства молока будем рассматривать обычную линейную модель множественной регрессии вида:

(1)

Оценим регрессию:

Source | SS df MS Number of obs = 216

-------------+------------------------------ F(8, 207) = 478.62

Model | 32860476 8 4107559.5 Prob > F = 0.0000

Residual | 1776477.57 207 8582.01723 R-squared = 0.9487

-------------+------------------------------ Adj R-squared = 0.9467

Total | 34636953.6 215 161102.11 Root MSE = 92.639

 

------------------------------------------------------------------------------

pr | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

pog | 1.077489.0365411 29.49 0.000 1.005449 1.14953

volsbor |.0327746.0042294 7.75 0.000.0244362.0411129

nadoi |.0735436.0075843 9.70 0.000.0585913.0884959

rashod | 5.995707 1.532952 3.91 0.000 2.973506 9.017907

inv |.0000654.0000937 0.70 0.486 -.0001193.00025

zan | -4.98057 4.464866 -1.12 0.266 -13.78301 3.82187

potr |.6201765.1623831 3.82 0.000.3000399.9403132

trans |.7226653.3206016 2.25 0.025.0906022 1.354728

_cons | -17.04907 458.8572 -0.04 0.970 -921.6817 887.5836

 

Регрессия значима в целом (F (8,207) = 478,62). Незначимыми на 5% уровне значимости оказались коэффициенты при переменных инвестиции в основной капитал, численность занятых в экономике и константа регрессии. Показателями, влияющими на величину производство молока, являются:

1. поголовье КРС. При увеличении поголовья на 1 тыс. голов производство молока увеличится на 1,077 тыс. тонн;

2. валовый сбор зерна. При увеличении сбора зерна на 1 тыс. тонн производство увеличится на 0,03 тыс. тонн;

3. надои на одну корову. При увеличении надоя на 1кг производство увеличится на 0,07 тыс. тонн;

4. расход кормов. При увеличении расхода кормов на 1 центнер производство увеличится на 5,99 тыс. тонн;

5. потребление молока и молочных продуктов. При увеличении потребления на 1 кг производство увеличится на 0,62 тыс. тонн;

6. перевозка грузов. При увеличении перевозки грузов на 1 млн. тонн производство увеличится на 0,72 тыс. тонн;

Проверим предположение о гетероскедастичности ошибок. Выполним тест Бреуша-Пагана на гомоскедастичность.

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity

Ho: Constant variance

Variables: fitted values of pr

chi2(1) = 11.00

Prob > chi2 = 0.0009

 

Тест отвергает гипотезу о гомоскедастичности ошибок.

Улучшим модель. Построим модель вида:

(2)

Source | SS df MS Number of obs = 216

-------------+------------------------------ F(6, 209) = 639.00

Model | 32846415.5 6 5474402.58 Prob > F = 0.0000

Residual | 1790538.12 209 8567.16802 R-squared = 0.9483

-------------+------------------------------ Adj R-squared = 0.9468

Total | 34636953.6 215 161102.11 Root MSE = 92.559

 

------------------------------------------------------------------------------

pr | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

pog | 1.074807.0364403 29.49 0.000 1.002969 1.146645

nadoi |.0751202.0074733 10.05 0.000.0603874.089853

volsbor |.0324327.0042107 7.70 0.000.0241317.0407336

rashod | 6.228683 1.511776 4.12 0.000 3.248398 9.208967

trans |.8691106.2019206 4.30 0.000.4710485 1.267173

potr |.631181.1619483 3.90 0.000.3119195.9504426

_cons | -526.6714 46.88699 -11.23 0.000 -619.1035 -434.2394

------------------------------------------------------------------------------

Все коэффициенты в уравнении значимы. Регрессия значима в целом (F (6,209) = 639).

Проверим предположение о гетероскедастичности ошибок. Выполним тест Бреуша-Пагана на гомоскедастичность.

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity

Ho: Constant variance

Variables: fitted values of pr

 

chi2(1) = 12.19

Prob > chi2 = 0.0005

Тест принимает гипотезу о гетероскедастичности ошибок.

Качество подгонки первой модели лучше, чем у второй.

 

5. Модель с фиксированным эффектом

В модели с фиксированным эффектом считается, что регионы не могут быть выбраны случайно из некоторой генеральной совокупности. Модель с фиксированным эффектом для исследуемых показателей представим в виде уравнения:

(3)

Оценим модель с фиксированным эффектом:

Fixed-effects (within) regression Number of obs = 216

Group variable: n Number of groups = 72

 

R-sq: within = 0.3260 Obs per group: min = 3

between = 0.7743 avg = 3.0

overall = 0.7726 max = 3

F(8,136) = 8.22

corr(u_i, Xb) = 0.6709 Prob > F = 0.0000

 

------------------------------------------------------------------------------

pr | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

pog |.5185391.1422266 3.65 0.000.2372773.7998008

volsbor | -.004452.0033537 -1.33 0.187 -.0110841.0021801

nadoi |.0174413.0091311 1.91 0.058 -.000616.0354986

rashod | 1.273375 1.363432 0.93 0.352 -1.422894 3.969644

inv |.0001001.0000579 1.73 0.086 -.0000144.0002145

zan | 1.137697 1.327435 0.86 0.393 -1.487387 3.762781

potr | 1.289398.2285097 5.64 0.000.837506 1.74129

trans | -.7067228.222021 -3.18 0.002 -1.145783 -.2676627

_cons | -205.0917 150.9301 -1.36 0.176 -503.5652 93.38181

-------------+----------------------------------------------------------------

sigma_u | 258.45309

sigma_e | 19.589534

rho |.99428789 (fraction of variance due to u_i)

------------------------------------------------------------------------------

F test that all u_i=0: F(71, 136) = 63.29 Prob > F = 0.0000

 

Модель значима в целом (F (8,136) = 8,22). Результаты оценивания показывают, что при предположении о наличии индивидуальных различий, стали незначимы валовый сбор зерна, надои, расход кормов. Незначимыми так же остались инвестиции в основной капитал, численность занятых в экономике и константа регрессии.

В результате получили, что при увеличении поголовья КРС на 1 тыс. голов производство молока увеличивается на 0,52 тыс. тонн. Увеличение потребления на 1 кг приводит к увеличению производства на 1,29 тыс. тонн. Увеличение перевозок на 1 млн. тонн приводит к уменьшению производства на 0,71 тыс. тонн.

99% вариации данных приходится на индивидуальные эффекты. Корреляция индивидуальных эффектов с регрессорами высокая: corr(u_i, Xb) = 0,6709. Модель с фиксированными эффектами предпочтительнее. F -тест (F (71, 136) = 63,29) отвергает нулевую гипотезу об отсутствии индивидуальных эффектов.

 


6. Модель со случайным эффектом

 

Модель со случайным эффектом описывается уравнением:

(4)

Оценим модель со случайным эффектом:

Random-effects GLS regression Number of obs = 216

Group variable: n Number of groups = 72

 

R-sq: within = 0.1896 Obs per group: min = 3

between = 0.9204 avg = 3.0

overall = 0.9184 max = 3

 

Random effects u_i ~ Gaussian Wald chi2(8) = 857.43

corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000

 

------------------------------------------------------------------------------

pr | Coef. Std. Err. z P>|z| [95% Conf. Interval]

-------------+----------------------------------------------------------------

pog | 1.152966.0519977 22.17 0.000 1.051052 1.25488

volsbor |.0046947.0036118 1.30 0.194 -.0023842.0117736

nadoi |.0544514.0087701 6.21 0.000.0372623.0716404

rashod | 2.942768 1.468632 2.00 0.045.0643027 5.821233

inv |.0001514.0000621 2.44 0.015.0000296.0002731

zan | -.4139141 1.511491 -0.27 0.784 -3.376382 2.548554

potr |.9531952.2017282 4.73 0.000.5578151 1.348575

trans | -.0690033.2250017 -0.31 0.759 -.5099985.3719918

_cons | -366.5325 166.7721 -2.20 0.028 -693.3999 -39.6652

-------------+----------------------------------------------------------------

sigma_u | 91.177117

sigma_e | 19.589534

rho |.95587569 (fraction of variance due to u_i)

------------------------------------------------------------------------------

 

Регрессия в целом значима (Wald chi2(8) = 857,43). Есть отличия в оценках с объединенной регрессией и с моделью с фиксированным эффектом. Стали незначимы на 5% уровне коэффициенты при валовом сборе зерна, численностью занятых в экономике и перевозках грузов. Все остальные – значимы на 5% уровне.

В результате получили, что при увеличении поголовья КРС на 1 тыс. голов производство молока увеличивается на 1,15 тыс. тонн. Увеличение надоев на 1 кг увеличивает производство молока на 0,05 тыс. тонн. Увеличение расхода кормов на 1 центнер увеличивает производство на 2,94 тыс. тонн. Увеличение инвестирования в основной капитал не способствует увеличению производства, но и не снижает его. Увеличение потребления на 1 кг приводит к увеличению производства на 0,95 тыс. тонн.

Проверим гипотезу о наличие случайных эффектов с помощью теста Хаусмана:

---- Coefficients ----

| (b) (B) (b-B) sqrt(diag(V_b-V_B))

| fixed. Difference S.E.

-------------+----------------------------------------------------------------

pog |.5185391 1.152966 -.634427.1323807

volsbor | -.004452.0046947 -.0091467.

nadoi |.0174413.0544514 -.0370101.0025421

rashod | 1.273375 2.942768 -1.669393.

inv |.0001001.0001514 -.0000513.

zan | 1.137697 -.4139141 1.551611.

potr | 1.289398.9531952.3362028.1073425

trans | -.7067228 -.0690033 -.6377194.

------------------------------------------------------------------------------

b = consistent under Ho and Ha; obtained from xtreg

B = inconsistent under Ha, efficient under Ho; obtained from xtreg

Test: Ho: difference in coefficients not systematic

chi2(7) = (b-B)'[(V_b-V_B)^(-1)](b-B)= 155.68

Prob>chi2 = 0.0000

Тест Хаусмана отвергает гипотезу о наличии случайных эффектов в пользу гипотезы о наличии фиксированных индивидуальных эффектов. Следовательно, модель с фиксированными эффектами предпочтительнее.


 

7. Модель в среднем

 

Модель в среднем описывается уравнением:

(5)

Оценим модель в среднем:

 

GEE population-averaged model Number of obs = 216

Group variable: n Number of groups = 72

Link: identity Obs per group: min = 3

Family: Gaussian avg = 3.0

Correlation: exchangeable max = 3

Wald chi2(8) = 727.12

Scale parameter: 15039.94 Prob > chi2 = 0.0000

 

------------------------------------------------------------------------------

pr | Coef. Std. Err. z P>|z| [95% Conf. Interval]

-------------+----------------------------------------------------------------

pog | 1.140037.0540719 21.08 0.000 1.034059 1.246016

volsbor |.0031872.0034227 0.93 0.352 -.0035213.0098956

nadoi |.0495857.008523 5.82 0.000.032881.0662904

rashod | 2.671853 1.398885 1.91 0.056 -.0699113 5.413618

inv |.0001493.000059 2.53 0.011.0000337.0002649

zan | -.36397 1.410459 -0.26 0.796 -3.128418 2.400478

potr | 1.040851.1977189 5.26 0.000.6533295 1.428373

trans | -.1785092.2153198 -0.83 0.407 -.6005283.2435098

_cons | -358.448 156.8215 -2.29 0.022 -665.8125 -51.08346

------------------------------------------------------------------------------

Регрессия в целом значима (Wald chi2(8) = 727,12). Наблюдаются отличия в оценках как в сравнении с объединенной регрессией, так и с моделью с фиксированным и случайным эффектом. Стали незначимы на 5% уровне коэффициенты при валовом сборе зерна, расходе кормов на одну корову, численностью занятых в экономике и при перевозках грузов. Все остальные – значимы на 5% уровне.

В результате получили, что при увеличении поголовья КРС на 1 тыс. голов производство молока увеличивается на 1,14 тыс. тонн. Увеличение надоев на 1 кг увеличивает производство молока на 0,05 тыс. тонн. Увеличение инвестирования в основной капитал не способствует увеличению производства, но и не снижает его. Увеличение потребления на 1 кг приводит к увеличению производства на 1,04 тыс. тонн.

 

Вывод

 

Эконометрическое исследование проводилось по панельным данным, включающим показатели по 72 регионам России, данные за 2007 - 2009 годы. Благодаря специальной структуре панельные данные имеют ряд преимуществ:

1. эффективность получаемых оценок выше;

2. данные позволяют контролировать и тестировать индивидуальную неоднородность по объектам;

3. данные позволяют выявить эффекты, которые в пространственных данных нельзя обнаружить;

4. данные позволяют строить более гибкие и содержательные модели.

Для объяснения объемов производства молока были построены 4 модели: простая объединенная модель регрессии, модель с фиксированным эффектом, модель со случайным эффектом и модель в среднем. Были проведены тесты на сравнение моделей.

В ходе исследования было выявлено, что на производство молока сильно влияют: поголовье КРС, надои и потребление.

При построении моделей с фиксированными эффектами с помощью F -теста была отвергнута нулевая гипотеза об отсутствии индивидуальных эффектов.

Статистический тест Хаусмана показал, что лучшей является модель с фиксированным эффектом для объяснения объемов производства молока.

 

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2019-04-30 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: