Пример решения эконометрической задачи в Gretl-3

Ниже приведено условие задачи и текстовая часть решения.  Закачка файла gtd  в архиве rar(c решением в программе Gretl), начнется автоматически через 10 секунд. Еще примеры решения задач по эконометрике можно посмотреть  здесь.

Во всех вариантах требуется выполнить:

I.                  Построение двухфакторной модели регрессии

1.     Построение спецификации эконометрической модели.   Исследование взаимосвязи переменных с помощью диаграммы рассеяния и коэффициента корреляции

Привести постановку задачи построения модели линейной регрессии. Указать эндогенную переменную и экзогенные переменные. Построить графики диаграмм рассеяния зависимой переменной с экзогенными факторами.  Сделать предположения относительно знаков (положительный или отрицательный) параметров модели.

Построить матрицу парных коэффициентов линейной корреляции, проанализировать тесноту и направление связи между переменными, проверить значимость коэффициентов парной корреляции. Протестировать данные на мультиколлинеарность.

2.     Оценка параметров модели парной регрессии

Оценить параметры модели регрессии (1)

  (1).

. Выпишите полученное уравнение регрессии в стандартной форме. Дайте экономическую интерпретацию параметрам модели.

1.     Оценивание качества спецификации модели

Проверить статистическую значимость регрессии в целом. Проверить статистическую значимость оценок параметров. Оцените качество модели (коэффициент детерминации, стандартная ошибка, средняя относительная ошибка аппроксимации). Сделайте выводы о качестве уравнения регрессии.

2.     Проверка предпосылки теоремы Гаусса-Маркова об отсутствии автокорреляции случайных возмущений

Привести результаты тестирования на отсутствие автокорреляции случайных возмущений с помощью теста Дарбина -Уотсона и Бреуша-Годфри.  Сделать выводы. При необходимости выполнить корректировку модели.

3.     Проверка второй предпосылки теоремы Гаусса-Маркова о гомоскедастичности случайных возмущений.

 Выполнить визуальный анализ остатков с помощью графика.  Привести результаты тестирования на отсутствие гомоскедастичность с помощью тестов Голдфельда-Квандта и Бреуша-Пагана.

6.     Проверить адекватность модели (1). В качестве контролирующей выборки использовать данные за последние два квартала.

 

II.               Прогнозирование эндогенной переменной

7.     Оценить параметры модели парной регрессии с наиболее значимым фактором

Оценить параметры модели (2) парной регрессии с наиболее значимым фактором

  (2)

 

8.     Моделирование сезонных составляющих уровней временного

ряда при помощи фиктивных переменных.

В связи с тем, что объясняющая переменная представляет собой временной ряд, одной из составляющих компонент которого может быть сезонная волна, необходимо учесть эту структуру для дальнейшего прогноза, вводя фиктивные переменные для соответствующих кварталов. Постройте график изменения     экзогенной переменной   во времени с целью визуального выявления сезонной волны.

 Введите необходимое количество фиктивных переменных, характеризующих степень влияния каждого квартала в отдельности.  Постройте многофакторную модель динамики     экзогенной переменной.

Оцените параметры модели (3) множественной регрессии

     (3)

 Оцените качество и значимость модели и отдельных ее параметров. Поясните экономический смысл параметров при фиктивных переменных сдвига при исследовании сезонных колебаний. Выполните тестирование на отсутствие автокорреляции случайных возмущений с помощью Дарбина -Уотсона и Бреуша-Годфри.

9.     Прогнозирование экзогенной переменной

Использовать построенную многофакторную модель с фиктивными переменными для прогнозирования экзогенной переменной.

Оценить прогноз   по модели (3)

 

10. Прогнозирование эндогенной переменной

Оценить прогноз по модели (2), используя полученные прогнозные значения X

— прогноз значения эндогенной переменной для момента )

Подставив прогнозные значения  в модель (2), получим точечный прогноз :

                                                       

 

 

 

ВАРИАНТ 27

Ставится задача исследовать, как влияет индекс реальных инвестиций в основной капитал (X1) на Среднедушевые денежные доходы населения (Y).   Оба показателя – цепные индексы, где за базу (100%) взят уровень прошлых лет (1994 и 2002 соответственно). Данные с сайта http://sophist.hse.ru

T

Среднедушевые денежные доходы населения (Y)

Индекс реальных инвестиций в основной капитал (X1)

Индекс реального ВВП

(X2)

2009 I

14065,1

88,2

130,1

II

16967,9

123,7

138,4

III

16730,6

144,6

152,6

IV

19833,3

203,1

158,2

2010 I

16146,4

83,9

135,4

II

18690

130,5

145,3

III

18549,4

152,2

158,4

IV

22456

225,7

166,3

2011 I

17710,6

87,4

140,1

II

20417,6

140,6

149,8

III

20512,3

169,6

159,4

IV

24535

259,5

171,9

2012 I

19121

99,4

148,1

II

22591

155,4

157,1

III

23280,7

178,8

165

IV

27986,2

267,7

176

2013 I

21800

102

149,8

II

24990,4

155,8

159,8

III

25528,7

178,3

167,5

IV

30532,9

270,8

180,5

2014 I

22457,1

98,8

149,7

II

27059,3

156,2

160,7

III

27964,6

177,9

169,8

IV

32285

263,4

182,2

2015 I

25364

91,7

146,3

II

29723,1

138,2

154,5

III

29945,5

153,4

165,6

IV

36099,8

238,9

177,9

2016 I

26646,2

86

146

II

30234

130,7

155

III

30539,5

149,6

165,7

IV

36149,5

246,2

178,8

2017 I

27763

91,4

147,9

II

31306,6

137,8

158,6

III

31325

156,4

170,1

IV

37224,6

255,6

180,7

2018 I

29011,2

97,1

151,2

II

32455

145,6

162,7

III

32609,2

172,9

174,3

IV

38945

260,7

185,7

2019 I

30240,8

98,3

151,8

II

34569,1

145,9

164,6

III

35096,9

176

177

IV

41428,3

267,5

189,7

2020 I

31646,6

101,7

154,2

II

32932,2

138,1

151,3

III

34874,8

167,2

170,9

IV

42968,6

270,8

185,5

 

 

I.                  Построение двухфакторной модели регрессии

3.     Построение спецификации эконометрической модели.   Исследование взаимосвязи переменных с помощью диаграммы рассеяния и коэффициента корреляции

Экспортируем данные из файла Excel.

Y - Среднедушевые денежные доходы населения;

X1 - Индекс реальных инвестиций в основной капитал;

X2 - Индекс реального ВВП.

 

 

Построим графики диаграмм рассеяния зависимой переменной с экзогенными факторами. 

Видим, что объясняющие переменные подвержены сезонным колебаниям

 

Построим график объясняемой переменной:

Так же видим влияние сезонного фактора, но ещё наблюдаем трендовую составляющую, значение показателя растёт с течением времени.

 

Сделать предположения относительно положительности знаков параметров модели.

Построим матрицу парных коэффициентов линейной корреляции.

 

Коэффициенты корреляции, наблюдения 2009:1  - 2020:4

5% критические значения (двухсторонние) = 0,2845 для n = 48

 

Y

X1

X2

 

1,0000

0,5346

0,7719

Y

 

1,0000

0,8926

X1

 

 

1,0000

X2

 

Между Y и X2 имеется существенная корреляция, так как коэффициент корреляции свыше 0,7. Между Y и Х2 имеется связь, но она менее существена. Так же отметим тесную связь между Х1 и Х2, что говорит о наличии мультиколлениарности (тесной связи между объясняющими факторами)

4.     Оценка параметров модели парной регрессии

Оценить параметры модели регрессии (1)

  (1).

Построим модель регрессии методом наименьших квадратов.

 

Получим:

 

Модель 1: МНК, использованы наблюдения 2009:1-2020:4 (T = 48)

Зависимая переменная: Y

 

 

Коэффициент

Ст. ошибка

t-статистика

P-значение

 

const

-73670,5

11218,6

-6,5668

<0,00001

***

X1

-89,7237

20,9104

-4,2909

0,00009

***

X2

718,54

87,7348

8,1899

<0,00001

***

 

Среднее зав. перемен

 27527,28

 

Ст. откл. зав. перемен

 7046,551

Сумма кв. остатков

 6,69e+08

 

Ст. ошибка модели

 3856,497

R-квадрат

 0,713221

 

Испр. R-квадрат

 0,700475

F(2, 45)

 55,95760

 

Р-значение (F)

 6,23e-13

Лог. правдоподобие

-462,9208

 

Крит. Акаике

 931,8417

Крит. Шварца

 937,4553

 

Крит. Хеннана-Куинна

 933,9630

Параметр rho

 0,337654

 

Стат. Дарбина-Вотсона

 1,289306

 

Уравнение запишется в виде:

Y = -73670,5 -89,7237*X1 + 718,54*X2

При росте индекса реальных инвестиций (Х1) на один процент располагаемый доходы сокращаются на 89,72 рубля. А при росте индекса реального ВВП на 1%, располагаемые доходы возрастут на 718,54 рубля.

 

5.     Оценивание качества спецификации модели

Проверим статистическую значимость регрессии в целом.

Р-значение (F) = 0,00000< 0.05. Следовательно, отклоняем нулевую гипотезу в пользу альтернативной. Уравнение регрессии значимо в целом.

Проверим статистическую значимость оценок параметров.

 

t-статистика

P-значение

const

-6,5668

<0,00001

X1

-4,2909

0,00009

X2

8,1899

<0,00001

Видим что P-значение для всех коэффициентов регрессии намного меньше 0,05. Отклоняем нулевую гипотезу в пользу альтернативной. Все коэффициенты регрессии статистически значимы.

Коэффициент детерминации составляет 0,713, это значит, что на 71,3% вариация переменной Y (среднедушевые денежные доходы населения) объясняется рассматриваемой моделью.

В целом можем пока признать модель приемлемой.

 

6.     Проверка предпосылки теоремы Гаусса-Маркова об отсутствии автокорреляции случайных возмущений

Привести результаты тестирования на отсутствие автокорреляции случайных возмущений с помощью теста Дарбина -Уотсона и Бреуша-Годфри. Проверим модель на автокорреляцию остатков, с помощью статистики Дарбина-Уотсона:

 

Стат. Дарбина-Вотсона

 1,289306


 DW = 1,289

При m=2 и n = 48, dl = 1.43, du = 1.615

DW<dl, следовательно в модели (1) наблюдаем автокорреляцию остатков.

Проведём тест Бреуша-Годфри.

 

 

Тест Бриша-Годфри (Breusch-Godfrey) на автокорреляцию вплоть до порядка 4

МНК, использованы наблюдения 2009:1-2020:4 (T = 48)

Зависимая переменная: uhat

 

             Коэффициент   Ст. ошибка   t-статистика  P-значение

  --------------------------------------------------------------

  const     8819,56        8523,88         1,035       0,3069  

  X1          30,8502        20,9890       1,470       0,1492  

  X2         -83,2261        69,9293      -1,190       0,2408   

  uhat_1       0,373463       0,187126     1,996       0,0526    *

  uhat_2       0,00950501     0,171009     0,05558     0,9559  

  uhat_3      -0,0444363      0,121636    -0,3653      0,7167  

  uhat_4       0,843061       0,121723     6,926       2,10e-08  ***

 

  Неисправленный R-квадрат = 0,661904

 

Тестовая статистика: LMF = 20,066804,

р-значение = P(F(4,41) > 20,0668) = 3,23e-009

 

Альтернативная статистика: TR^2 = 31,771376,

р-значение = P(Хи-квадрат(4) > 31,7714) = 2,13e-006

 

Ljung-Box Q' = 37,7085,

р-значение = P(Хи-квадрат(4) > 37,7085) = 1,29e-007

 

Отклоняется нулевая гипотеза, так как P(F(4,41) > 20,0668) = 3,23e-009<0.05.

 В модели (1) присутствует автокорреляция.

 

7.     Проверка второй предпосылки теоремы Гаусса-Маркова о гомоскедастичности случайных возмущений.

 Выполним визуальный анализ остатков с помощью графика. 

Видим, что разброс не является постоянным, а увеличивается с течением времени, следовательно, можем предположить наличие гетроскедастичности.

Проведём  тестирование на отсутствие гомоскедастичности с помощью тестов Вайта и Бреуша-Пагана.

Тест Вайта:

Тест Вайта (White) на гетероскедастичность

МНК, использованы наблюдения 2009:1-2020:4 (T = 48)

Зависимая переменная: uhat^2

 

               Коэффициент       Ст. ошибка     t-статистика  P-значение

  ----------------------------------------------------------------------

  const          -1,85093e+09      8,22045e+08     -2,252       0,0296   **

  X1             -7,27234e+06      3,17528e+06     -2,290       0,0271   **

  X2              3,09494e+07      1,32928e+07      2,328       0,0248   **

  sq_X1       -9574,37          3751,15            -2,552       0,0144   **

  X2_X3       65521,7          26981,8              2,428       0,0195   **

  sq_X2     -130665            54447,1             -2,400       0,0209   **

 

ВНИМАНИЕ: матрица данных близка к сингулярной!

 

  Неисправленный R-квадрат = 0,153621

 

Тестовая статистика: TR^2 = 7,373800,

р-значение = P(Хи-квадрат(5) > 7,373800) = 0,194291

 

Так как р-значение = P(Хи-квадрат(5) > 7,373800) = 0,194291>0.05. Принимаем нулевую гипотезу – гетероскедастичность в модели (1) отсутствует.

 

Тест Бреуша-Пагана.

Тест Бриша-Пэгана (Breusch-Pagan) на гетероскедастичность

МНК, использованы наблюдения 2009:1-2020:4 (T = 48)

Зависимая переменная: масштабированное uhat^2

 

             Коэффициент    Ст. ошибка   t-статистика   P-значение

  ----------------------------------------------------------------

  const       1,23383       4,06334         0,3036        0,7628 

  X1          0,000928134   0,00757369      0,1225        0,9030 

  X2         -0,00238974    0,0317773      -0,07520       0,9404 

 

  Объясненная сумма квадратов = 0,0405132

 

Тестовая статистика: LM = 0,020257,

р-значение = P(Хи-квадрат(2) > 0,020257) = 0,989923

 

Так как р-значение = P(Хи-квадрат(2) > 0,020257) = 0,989923

>0.05. Принимаем нулевую гипотезу – гетероскедастичность в модели (1) отсутствует.

 

 

 

 

 

 

 

8.     Проверить адекватность модели (1). В качестве контролирующей выборки использовать данные за последние два квартала.

Сделаем прогноз на два последние квартала:

Получим:

 

Для 95% доверительных интервалов, t(43, 0,025) = 2,017

 

 Набл.

Y

Предсказание

Ст. ошибка

95% доверительный интервал

2020:3

34874,8

33809,4

3869,81

(26005,1, 41613,6)

2020:4

42968,6

34520,2

3932,80

(26589,0, 42451,5)

 

Модель не можем признать адекватной, так как наблюдаемое значение 42968,6 выше верхнего 95% интервала 42451,5.

 

II.               Прогнозирование эндогенной переменной

9.     Оценить параметры модели парной регрессии с наиболее значимым фактором

Оценить параметры модели (2) парной регрессии с наиболее значимым фактором Х2

  (2)

Получим:

 

 

 

Модель 7: МНК, использованы наблюдения 2009:1-2020:4 (T = 48)

Зависимая переменная: Y

 

 

Коэффициент

Ст. ошибка

t-статистика

P-значение

 

const

-34139,2

7516,02

-4,5422

0,00004

***

X2

382,522

46,4458

8,2359

<0,00001

***

 

Среднее зав. перемен

 27527,28

 

Ст. откл. зав. перемен

 7046,551

Сумма кв. остатков

 9,43e+08

 

Ст. ошибка модели

 4527,912

R-квадрат

 0,595887

 

Испр. R-квадрат

 0,587102

F(1, 46)

 67,82958

 

Р-значение (F)

 1,33e-10

Лог. правдоподобие

-471,1524

 

Крит. Акаике

 946,3048

Крит. Шварца

 950,0472

 

Крит. Хеннана-Куинна

 947,7191

Параметр rho

 0,775430

 

Стат. Дарбина-Вотсона

 0,468646

 

Уравнение запишется в виде:

  (2)

 

10.  Моделирование сезонных составляющих уровней временного

ряда при помощи фиктивных переменных.

В связи с тем, что объясняющая переменная представляет собой временной ряд, одной из составляющих компонент которого может быть сезонная волна, необходимо учесть эту структуру для дальнейшего прогноза, вводя фиктивные переменные для соответствующих кварталов.

Построим график изменения     экзогенной переменной   во времени с целью визуального выявления сезонной волны.

 Введём фиктивные переменные, характеризующих степень влияния каждого квартала в отдельности. 

Постройте многофакторную модель динамики     экзогенной переменной.

Оцените параметры модели (3) множественной регрессии

     (3)

Получим:

 

 

 

Модель 9: МНК, использованы наблюдения 2009:1-2020:4 (T = 48)

Зависимая переменная: X2

 

 

Коэффициент

Ст. ошибка

t-статистика

P-значение

 

const

166,545

1,78396

93,3571

<0,00001

***

time

0,432233

0,0470332

9,1900

<0,00001

***

dq1

-30,6033

1,84232

-16,6113

<0,00001

***

dq2

-22,1022

1,83931

-12,0165

<0,00001

***

dq3

-10,9928

1,83751

-5,9824

<0,00001

***

 

Среднее зав. перемен

 161,2104

 

Ст. откл. зав. перемен

 14,22010

Сумма кв. остатков

 870,5503

 

Ст. ошибка модели

 4,499484

R-квадрат

 0,908401

 

Испр. R-квадрат

 0,899880

F(4, 43)

 106,6093

 

Р-значение (F)

 9,84e-22

Лог. правдоподобие

-137,6592

 

Крит. Акаике

 285,3185

Крит. Шварца

 294,6745

 

Крит. Хеннана-Куинна

 288,8541

Параметр rho

 0,656660

 

Стат. Дарбина-Вотсона

 0,642616

Уравнение запишется в виде:

     (3)

 Оценим качество и значимость модели и отдельных ее параметров.

Р-значение (F) = 0,00000< 0.05. Следовательно, отклоняем нулевую гипотезу в пользу альтернативной. Уравнение регрессии значимо в целом.

Проверим статистическую значимость оценок параметров.

 

t-статистика

P-значение

const

93,3571

<0,00001

time

9,1900

<0,00001

dq1

-16,6113

<0,00001

dq2

-12,0165

<0,00001

dq3

-5,9824

<0,00001

Видим, что P-значение для всех коэффициентов регрессии намного меньше 0,05. Отклоняем нулевую гипотезу в пользу альтернативной. Все коэффициенты регрессии статистически значимы.

Коэффициент детерминации составляет 0,908, это значит, что на 90,8% вариация переменной Х2 (индекс реального ВВП) объясняется рассматриваемой моделью.

 

 

 

Экономический смысл параметров при фиктивных переменных сдвига при исследовании сезонных колебаний означает, что в случае первого квартала, рост Х2 по сравнению четвёриым составляет: -30,6033 (имеем падение показателя в каждом первом квартале года). Аналогично для других кварталов.

Выполним тестирование на отсутствие автокорреляции случайных возмущений с помощью Дарбина -Уотсона и Бреуша-Годфри.

Проверим модель на автокорреляцию остатков, с помощью статистики Дарбина-Уотсона:

 

Стат. Дарбина-Вотсона

0,642616


 DW = 0,6426

При m=4 и n = 48, dl = 1.336, du = 1.72

DW<dl, следовательно в модели (3) наблюдаем автокорреляцию остатков.

Проведём тест Бреуша-Годфри.

Тест Бриша-Годфри (Breusch-Godfrey) на автокорреляцию вплоть до порядка 4

МНК, использованы наблюдения 2009:1-2020:4 (T = 48)

Зависимая переменная: uhat

 

             Коэффициент   Ст. ошибка   t-статистика   P-значение

  ---------------------------------------------------------------

  const       0,357807     1,40541         0,2546        0,8004 

  time       -0,0148546    0,0377767      -0,3932        0,6963 

  dq1        -0,132055     1,45044        -0,09104       0,9279 

  dq2        -0,209431     1,43637        -0,1458        0,8848 

  dq3        -0,0697222    1,42676        -0,04887       0,9613 

  uhat_1      0,631288     0,158437        3,984         0,0003   ***

  uhat_2     -0,0731280    0,190334       -0,3842        0,7029 

  uhat_3      0,0303800    0,235084        0,1292        0,8978 

  uhat_4      0,190222     0,199530        0,9534        0,3463 

 

  Неисправленный R-квадрат = 0,453882

 

Тестовая статистика: LMF = 8,103299,

р-значение = P(F(4,39) > 8,1033) = 7,42e-005

 

Альтернативная статистика: TR^2 = 21,786357,

р-значение = P(Хи-квадрат(4) > 21,7864) = 0,000221

 

Ljung-Box Q' = 42,613,

р-значение = P(Хи-квадрат(4) > 42,613) = 1,24e-008

 

Отклоняется нулевая гипотеза, так как P(F(4,39) > 8,1033) = 7,42e-005<0.05.

 В модели (3) присутствует автокорреляция.

 

 

11.  Прогнозирование экзогенной переменной

Используя построенную многофакторную модель с фиктивными переменными для прогнозирования экзогенной переменной.

Оценить прогноз   по модели (3)

 

 

 

Получим:

 

Для 95% доверительных интервалов, t(43, 0,025) = 2,017

 

 Набл.

X2

Предсказание

Ст. ошибка

95% доверительный интервал

2021:1

не определено

157,121

4,84023

(147,360, 166,883)

2021:2

не определено

166,055

4,84023

(156,293, 175,816)

 

 

12. Прогнозирование эндогенной переменной

Оценим прогноз по модели (2), используя полученные прогнозные значения X

— прогноз значения эндогенной переменной для момента )

Подставив прогнозные значения  в модель (2), получим точечный прогноз :

                                                       

 

Получим:

 

 

Для 95% доверительных интервалов, t(46, 0,025) = 2,013

 

 Набл.

Y

Предсказание

Ст. ошибка

95% доверительный интервал

2021:1

не определено

25963,0

4578,78

(16746,4, 35179,6)

2021:2

не определено

29380,4

4580,36

(20160,6, 38600,2)

 

На последующие два квартала 2021 года имеем значения среднедушевых доходов в размере 25963 и 29380,4 рублей соответственно.

Имя файла: var27.rar

Размер файла: 460.67 Kb

Если закачивание файла не начнется через 10 сек, кликните по этой ссылке