Пример решения эконометрической задачи в Gretl-3
Ниже приведено условие задачи и текстовая часть решения. Закачка файла gtd в архиве rar(c решением в программе Gretl), начнется автоматически через 10 секунд. Еще примеры решения задач по эконометрике можно посмотреть здесь.
Во всех вариантах требуется выполнить:
I. Построение двухфакторной модели регрессии
1. Построение спецификации эконометрической модели. Исследование взаимосвязи переменных с помощью диаграммы рассеяния и коэффициента корреляции
Привести постановку задачи построения модели линейной регрессии. Указать эндогенную переменную и экзогенные переменные. Построить графики диаграмм рассеяния зависимой переменной с экзогенными факторами. Сделать предположения относительно знаков (положительный или отрицательный) параметров модели.
Построить матрицу парных коэффициентов линейной корреляции, проанализировать тесноту и направление связи между переменными, проверить значимость коэффициентов парной корреляции. Протестировать данные на мультиколлинеарность.
2. Оценка параметров модели парной регрессии
Оценить параметры модели регрессии (1)
(1).
. Выпишите полученное уравнение регрессии в стандартной форме. Дайте экономическую интерпретацию параметрам модели.
1. Оценивание качества спецификации модели
Проверить статистическую значимость регрессии в целом. Проверить статистическую значимость оценок параметров. Оцените качество модели (коэффициент детерминации, стандартная ошибка, средняя относительная ошибка аппроксимации). Сделайте выводы о качестве уравнения регрессии.
2. Проверка предпосылки теоремы Гаусса-Маркова об отсутствии автокорреляции случайных возмущений
Привести результаты тестирования на отсутствие автокорреляции случайных возмущений с помощью теста Дарбина -Уотсона и Бреуша-Годфри. Сделать выводы. При необходимости выполнить корректировку модели.
3. Проверка второй предпосылки теоремы Гаусса-Маркова о гомоскедастичности случайных возмущений.
Выполнить визуальный анализ остатков с помощью графика. Привести результаты тестирования на отсутствие гомоскедастичность с помощью тестов Голдфельда-Квандта и Бреуша-Пагана.
6. Проверить адекватность модели (1). В качестве контролирующей выборки использовать данные за последние два квартала.
II. Прогнозирование эндогенной переменной
7. Оценить параметры модели парной регрессии с наиболее значимым фактором
Оценить параметры модели (2) парной регрессии с наиболее значимым фактором
(2)
8. Моделирование сезонных составляющих уровней временного
ряда при помощи фиктивных переменных.
В связи с тем, что объясняющая переменная представляет собой временной ряд, одной из составляющих компонент которого может быть сезонная волна, необходимо учесть эту структуру для дальнейшего прогноза, вводя фиктивные переменные для соответствующих кварталов. Постройте график изменения экзогенной переменной во времени с целью визуального выявления сезонной волны.
Введите необходимое количество фиктивных переменных, характеризующих степень влияния каждого квартала в отдельности. Постройте многофакторную модель динамики экзогенной переменной.
Оцените параметры модели (3) множественной регрессии
(3)
Оцените качество и значимость модели и отдельных ее параметров. Поясните экономический смысл параметров при фиктивных переменных сдвига при исследовании сезонных колебаний. Выполните тестирование на отсутствие автокорреляции случайных возмущений с помощью Дарбина -Уотсона и Бреуша-Годфри.
9. Прогнозирование экзогенной переменной
Использовать построенную многофакторную модель с фиктивными переменными для прогнозирования экзогенной переменной.
Оценить прогноз
по модели (3)
10. Прогнозирование эндогенной переменной
Оценить прогноз по модели (2), используя полученные прогнозные значения X
— прогноз значения эндогенной переменной для момента
)
Подставив прогнозные значения в модель (2), получим точечный прогноз
:
ВАРИАНТ 27
Ставится задача исследовать, как влияет индекс реальных инвестиций в основной капитал (X1) на Среднедушевые денежные доходы населения (Y). Оба показателя – цепные индексы, где за базу (100%) взят уровень прошлых лет (1994 и 2002 соответственно). Данные с сайта http://sophist.hse.ru
T |
Среднедушевые денежные доходы населения (Y) |
Индекс реальных инвестиций в основной капитал (X1) |
Индекс реального ВВП (X2) |
2009 I |
14065,1 |
88,2 |
130,1 |
II |
16967,9 |
123,7 |
138,4 |
III |
16730,6 |
144,6 |
152,6 |
IV |
19833,3 |
203,1 |
158,2 |
2010 I |
16146,4 |
83,9 |
135,4 |
II |
18690 |
130,5 |
145,3 |
III |
18549,4 |
152,2 |
158,4 |
IV |
22456 |
225,7 |
166,3 |
2011 I |
17710,6 |
87,4 |
140,1 |
II |
20417,6 |
140,6 |
149,8 |
III |
20512,3 |
169,6 |
159,4 |
IV |
24535 |
259,5 |
171,9 |
2012 I |
19121 |
99,4 |
148,1 |
II |
22591 |
155,4 |
157,1 |
III |
23280,7 |
178,8 |
165 |
IV |
27986,2 |
267,7 |
176 |
2013 I |
21800 |
102 |
149,8 |
II |
24990,4 |
155,8 |
159,8 |
III |
25528,7 |
178,3 |
167,5 |
IV |
30532,9 |
270,8 |
180,5 |
2014 I |
22457,1 |
98,8 |
149,7 |
II |
27059,3 |
156,2 |
160,7 |
III |
27964,6 |
177,9 |
169,8 |
IV |
32285 |
263,4 |
182,2 |
2015 I |
25364 |
91,7 |
146,3 |
II |
29723,1 |
138,2 |
154,5 |
III |
29945,5 |
153,4 |
165,6 |
IV |
36099,8 |
238,9 |
177,9 |
2016 I |
26646,2 |
86 |
146 |
II |
30234 |
130,7 |
155 |
III |
30539,5 |
149,6 |
165,7 |
IV |
36149,5 |
246,2 |
178,8 |
2017 I |
27763 |
91,4 |
147,9 |
II |
31306,6 |
137,8 |
158,6 |
III |
31325 |
156,4 |
170,1 |
IV |
37224,6 |
255,6 |
180,7 |
2018 I |
29011,2 |
97,1 |
151,2 |
II |
32455 |
145,6 |
162,7 |
III |
32609,2 |
172,9 |
174,3 |
IV |
38945 |
260,7 |
185,7 |
2019 I |
30240,8 |
98,3 |
151,8 |
II |
34569,1 |
145,9 |
164,6 |
III |
35096,9 |
176 |
177 |
IV |
41428,3 |
267,5 |
189,7 |
2020 I |
31646,6 |
101,7 |
154,2 |
II |
32932,2 |
138,1 |
151,3 |
III |
34874,8 |
167,2 |
170,9 |
IV |
42968,6 |
270,8 |
185,5 |
I. Построение двухфакторной модели регрессии
3. Построение спецификации эконометрической модели. Исследование взаимосвязи переменных с помощью диаграммы рассеяния и коэффициента корреляции
Экспортируем данные из файла Excel.
Y - Среднедушевые денежные доходы населения;
X1 - Индекс реальных инвестиций в основной капитал;
X2 - Индекс реального ВВП.
Построим графики диаграмм рассеяния зависимой переменной с экзогенными факторами.
Видим, что объясняющие переменные подвержены сезонным колебаниям
Построим график объясняемой переменной:
Так же видим влияние сезонного фактора, но ещё наблюдаем трендовую составляющую, значение показателя растёт с течением времени.
Сделать предположения относительно положительности знаков параметров модели.
Построим матрицу парных коэффициентов линейной корреляции.
Коэффициенты корреляции, наблюдения 2009:1 - 2020:4
5% критические значения (двухсторонние) = 0,2845 для n = 48
Y |
X1 |
X2 |
|
1,0000 |
0,5346 |
0,7719 |
Y |
|
1,0000 |
0,8926 |
X1 |
|
|
1,0000 |
X2 |
Между Y и X2 имеется существенная корреляция, так как коэффициент корреляции свыше 0,7. Между Y и Х2 имеется связь, но она менее существена. Так же отметим тесную связь между Х1 и Х2, что говорит о наличии мультиколлениарности (тесной связи между объясняющими факторами)
4. Оценка параметров модели парной регрессии
Оценить параметры модели регрессии (1)
(1).
Построим модель регрессии методом наименьших квадратов.
Получим:
Модель 1: МНК, использованы наблюдения 2009:1-2020:4 (T = 48)
Зависимая переменная: Y
|
Коэффициент |
Ст. ошибка |
t-статистика |
P-значение |
|
const |
-73670,5 |
11218,6 |
-6,5668 |
<0,00001 |
*** |
X1 |
-89,7237 |
20,9104 |
-4,2909 |
0,00009 |
*** |
X2 |
718,54 |
87,7348 |
8,1899 |
<0,00001 |
*** |
Среднее зав. перемен |
27527,28 |
|
Ст. откл. зав. перемен |
7046,551 |
Сумма кв. остатков |
6,69e+08 |
|
Ст. ошибка модели |
3856,497 |
R-квадрат |
0,713221 |
|
Испр. R-квадрат |
0,700475 |
F(2, 45) |
55,95760 |
|
Р-значение (F) |
6,23e-13 |
Лог. правдоподобие |
-462,9208 |
|
Крит. Акаике |
931,8417 |
Крит. Шварца |
937,4553 |
|
Крит. Хеннана-Куинна |
933,9630 |
Параметр rho |
0,337654 |
|
Стат. Дарбина-Вотсона |
1,289306 |
Уравнение запишется в виде:
Y = -73670,5 -89,7237*X1 + 718,54*X2
При росте индекса реальных инвестиций (Х1) на один процент располагаемый доходы сокращаются на 89,72 рубля. А при росте индекса реального ВВП на 1%, располагаемые доходы возрастут на 718,54 рубля.
5. Оценивание качества спецификации модели
Проверим статистическую значимость регрессии в целом.
Р-значение (F) = 0,00000< 0.05. Следовательно, отклоняем нулевую гипотезу в пользу альтернативной. Уравнение регрессии значимо в целом.
Проверим статистическую значимость оценок параметров.
|
t-статистика |
P-значение |
const |
-6,5668 |
<0,00001 |
X1 |
-4,2909 |
0,00009 |
X2 |
8,1899 |
<0,00001 |
Видим что P-значение для всех коэффициентов регрессии намного меньше 0,05. Отклоняем нулевую гипотезу в пользу альтернативной. Все коэффициенты регрессии статистически значимы.
Коэффициент детерминации составляет 0,713, это значит, что на 71,3% вариация переменной Y (среднедушевые денежные доходы населения) объясняется рассматриваемой моделью.
В целом можем пока признать модель приемлемой.
6. Проверка предпосылки теоремы Гаусса-Маркова об отсутствии автокорреляции случайных возмущений
Привести результаты тестирования на отсутствие автокорреляции случайных возмущений с помощью теста Дарбина -Уотсона и Бреуша-Годфри. Проверим модель на автокорреляцию остатков, с помощью статистики Дарбина-Уотсона:
Стат. Дарбина-Вотсона |
1,289306 |
DW = 1,289
При m=2 и n = 48, dl = 1.43, du = 1.615
DW<dl, следовательно в модели (1) наблюдаем автокорреляцию остатков.
Проведём тест Бреуша-Годфри.
Тест Бриша-Годфри (Breusch-Godfrey) на автокорреляцию вплоть до порядка 4
МНК, использованы наблюдения 2009:1-2020:4 (T = 48)
Зависимая переменная: uhat
Коэффициент Ст. ошибка t-статистика P-значение
--------------------------------------------------------------
const 8819,56 8523,88 1,035 0,3069
X1 30,8502 20,9890 1,470 0,1492
X2 -83,2261 69,9293 -1,190 0,2408
uhat_1 0,373463 0,187126 1,996 0,0526 *
uhat_2 0,00950501 0,171009 0,05558 0,9559
uhat_3 -0,0444363 0,121636 -0,3653 0,7167
uhat_4 0,843061 0,121723 6,926 2,10e-08 ***
Неисправленный R-квадрат = 0,661904
Тестовая статистика: LMF = 20,066804,
р-значение = P(F(4,41) > 20,0668) = 3,23e-009
Альтернативная статистика: TR^2 = 31,771376,
р-значение = P(Хи-квадрат(4) > 31,7714) = 2,13e-006
Ljung-Box Q' = 37,7085,
р-значение = P(Хи-квадрат(4) > 37,7085) = 1,29e-007
Отклоняется нулевая гипотеза, так как P(F(4,41) > 20,0668) = 3,23e-009<0.05.
В модели (1) присутствует автокорреляция.
7. Проверка второй предпосылки теоремы Гаусса-Маркова о гомоскедастичности случайных возмущений.
Выполним визуальный анализ остатков с помощью графика.
Видим, что разброс не является постоянным, а увеличивается с течением времени, следовательно, можем предположить наличие гетроскедастичности.
Проведём тестирование на отсутствие гомоскедастичности с помощью тестов Вайта и Бреуша-Пагана.
Тест Вайта:
Тест Вайта (White) на гетероскедастичность
МНК, использованы наблюдения 2009:1-2020:4 (T = 48)
Зависимая переменная: uhat^2
Коэффициент Ст. ошибка t-статистика P-значение
----------------------------------------------------------------------
const -1,85093e+09 8,22045e+08 -2,252 0,0296 **
X1 -7,27234e+06 3,17528e+06 -2,290 0,0271 **
X2 3,09494e+07 1,32928e+07 2,328 0,0248 **
sq_X1 -9574,37 3751,15 -2,552 0,0144 **
X2_X3 65521,7 26981,8 2,428 0,0195 **
sq_X2 -130665 54447,1 -2,400 0,0209 **
ВНИМАНИЕ: матрица данных близка к сингулярной!
Неисправленный R-квадрат = 0,153621
Тестовая статистика: TR^2 = 7,373800,
р-значение = P(Хи-квадрат(5) > 7,373800) = 0,194291
Так как р-значение = P(Хи-квадрат(5) > 7,373800) = 0,194291>0.05. Принимаем нулевую гипотезу – гетероскедастичность в модели (1) отсутствует.
Тест Бреуша-Пагана.
Тест Бриша-Пэгана (Breusch-Pagan) на гетероскедастичность
МНК, использованы наблюдения 2009:1-2020:4 (T = 48)
Зависимая переменная: масштабированное uhat^2
Коэффициент Ст. ошибка t-статистика P-значение
----------------------------------------------------------------
const 1,23383 4,06334 0,3036 0,7628
X1 0,000928134 0,00757369 0,1225 0,9030
X2 -0,00238974 0,0317773 -0,07520 0,9404
Объясненная сумма квадратов = 0,0405132
Тестовая статистика: LM = 0,020257,
р-значение = P(Хи-квадрат(2) > 0,020257) = 0,989923
Так как р-значение = P(Хи-квадрат(2) > 0,020257) = 0,989923
>0.05. Принимаем нулевую гипотезу – гетероскедастичность в модели (1) отсутствует.
8. Проверить адекватность модели (1). В качестве контролирующей выборки использовать данные за последние два квартала.
Сделаем прогноз на два последние квартала:
Получим:
Для 95% доверительных интервалов, t(43, 0,025) = 2,017
Набл. |
Y |
Предсказание |
Ст. ошибка |
95% доверительный интервал |
2020:3 |
34874,8 |
33809,4 |
3869,81 |
(26005,1, 41613,6) |
2020:4 |
42968,6 |
34520,2 |
3932,80 |
(26589,0, 42451,5) |
Модель не можем признать адекватной, так как наблюдаемое значение 42968,6 выше верхнего 95% интервала 42451,5.
II. Прогнозирование эндогенной переменной
9. Оценить параметры модели парной регрессии с наиболее значимым фактором
Оценить параметры модели (2) парной регрессии с наиболее значимым фактором Х2
(2)
Получим:
Модель 7: МНК, использованы наблюдения 2009:1-2020:4 (T = 48)
Зависимая переменная: Y
|
Коэффициент |
Ст. ошибка |
t-статистика |
P-значение |
|
const |
-34139,2 |
7516,02 |
-4,5422 |
0,00004 |
*** |
X2 |
382,522 |
46,4458 |
8,2359 |
<0,00001 |
*** |
Среднее зав. перемен |
27527,28 |
|
Ст. откл. зав. перемен |
7046,551 |
Сумма кв. остатков |
9,43e+08 |
|
Ст. ошибка модели |
4527,912 |
R-квадрат |
0,595887 |
|
Испр. R-квадрат |
0,587102 |
F(1, 46) |
67,82958 |
|
Р-значение (F) |
1,33e-10 |
Лог. правдоподобие |
-471,1524 |
|
Крит. Акаике |
946,3048 |
Крит. Шварца |
950,0472 |
|
Крит. Хеннана-Куинна |
947,7191 |
Параметр rho |
0,775430 |
|
Стат. Дарбина-Вотсона |
0,468646 |
Уравнение запишется в виде:
(2)
10. Моделирование сезонных составляющих уровней временного
ряда при помощи фиктивных переменных.
В связи с тем, что объясняющая переменная представляет собой временной ряд, одной из составляющих компонент которого может быть сезонная волна, необходимо учесть эту структуру для дальнейшего прогноза, вводя фиктивные переменные для соответствующих кварталов.
Построим график изменения экзогенной переменной во времени с целью визуального выявления сезонной волны.
Введём фиктивные переменные, характеризующих степень влияния каждого квартала в отдельности.
Постройте многофакторную модель динамики экзогенной переменной.
Оцените параметры модели (3) множественной регрессии
(3)
Получим:
Модель 9: МНК, использованы наблюдения 2009:1-2020:4 (T = 48)
Зависимая переменная: X2
|
Коэффициент |
Ст. ошибка |
t-статистика |
P-значение |
|
const |
166,545 |
1,78396 |
93,3571 |
<0,00001 |
*** |
time |
0,432233 |
0,0470332 |
9,1900 |
<0,00001 |
*** |
dq1 |
-30,6033 |
1,84232 |
-16,6113 |
<0,00001 |
*** |
dq2 |
-22,1022 |
1,83931 |
-12,0165 |
<0,00001 |
*** |
dq3 |
-10,9928 |
1,83751 |
-5,9824 |
<0,00001 |
*** |
Среднее зав. перемен |
161,2104 |
|
Ст. откл. зав. перемен |
14,22010 |
Сумма кв. остатков |
870,5503 |
|
Ст. ошибка модели |
4,499484 |
R-квадрат |
0,908401 |
|
Испр. R-квадрат |
0,899880 |
F(4, 43) |
106,6093 |
|
Р-значение (F) |
9,84e-22 |
Лог. правдоподобие |
-137,6592 |
|
Крит. Акаике |
285,3185 |
Крит. Шварца |
294,6745 |
|
Крит. Хеннана-Куинна |
288,8541 |
Параметр rho |
0,656660 |
|
Стат. Дарбина-Вотсона |
0,642616 |
Уравнение запишется в виде:
(3)
Оценим качество и значимость модели и отдельных ее параметров.
Р-значение (F) = 0,00000< 0.05. Следовательно, отклоняем нулевую гипотезу в пользу альтернативной. Уравнение регрессии значимо в целом.
Проверим статистическую значимость оценок параметров.
|
t-статистика |
P-значение |
const |
93,3571 |
<0,00001 |
time |
9,1900 |
<0,00001 |
dq1 |
-16,6113 |
<0,00001 |
dq2 |
-12,0165 |
<0,00001 |
dq3 |
-5,9824 |
<0,00001 |
Видим, что P-значение для всех коэффициентов регрессии намного меньше 0,05. Отклоняем нулевую гипотезу в пользу альтернативной. Все коэффициенты регрессии статистически значимы.
Коэффициент детерминации составляет 0,908, это значит, что на 90,8% вариация переменной Х2 (индекс реального ВВП) объясняется рассматриваемой моделью.
Экономический смысл параметров при фиктивных переменных сдвига при исследовании сезонных колебаний означает, что в случае первого квартала, рост Х2 по сравнению четвёриым составляет: -30,6033 (имеем падение показателя в каждом первом квартале года). Аналогично для других кварталов.
Выполним тестирование на отсутствие автокорреляции случайных возмущений с помощью Дарбина -Уотсона и Бреуша-Годфри.
Проверим модель на автокорреляцию остатков, с помощью статистики Дарбина-Уотсона:
Стат. Дарбина-Вотсона |
0,642616 |
DW = 0,6426
При m=4 и n = 48, dl = 1.336, du = 1.72
DW<dl, следовательно в модели (3) наблюдаем автокорреляцию остатков.
Проведём тест Бреуша-Годфри.
Тест Бриша-Годфри (Breusch-Godfrey) на автокорреляцию вплоть до порядка 4
МНК, использованы наблюдения 2009:1-2020:4 (T = 48)
Зависимая переменная: uhat
Коэффициент Ст. ошибка t-статистика P-значение
---------------------------------------------------------------
const 0,357807 1,40541 0,2546 0,8004
time -0,0148546 0,0377767 -0,3932 0,6963
dq1 -0,132055 1,45044 -0,09104 0,9279
dq2 -0,209431 1,43637 -0,1458 0,8848
dq3 -0,0697222 1,42676 -0,04887 0,9613
uhat_1 0,631288 0,158437 3,984 0,0003 ***
uhat_2 -0,0731280 0,190334 -0,3842 0,7029
uhat_3 0,0303800 0,235084 0,1292 0,8978
uhat_4 0,190222 0,199530 0,9534 0,3463
Неисправленный R-квадрат = 0,453882
Тестовая статистика: LMF = 8,103299,
р-значение = P(F(4,39) > 8,1033) = 7,42e-005
Альтернативная статистика: TR^2 = 21,786357,
р-значение = P(Хи-квадрат(4) > 21,7864) = 0,000221
Ljung-Box Q' = 42,613,
р-значение = P(Хи-квадрат(4) > 42,613) = 1,24e-008
Отклоняется нулевая гипотеза, так как P(F(4,39) > 8,1033) = 7,42e-005<0.05.
В модели (3) присутствует автокорреляция.
11. Прогнозирование экзогенной переменной
Используя построенную многофакторную модель с фиктивными переменными для прогнозирования экзогенной переменной.
Оценить прогноз
по модели (3)
Получим:
Для 95% доверительных интервалов, t(43, 0,025) = 2,017
Набл. |
X2 |
Предсказание |
Ст. ошибка |
95% доверительный интервал |
2021:1 |
не определено |
157,121 |
4,84023 |
(147,360, 166,883) |
2021:2 |
не определено |
166,055 |
4,84023 |
(156,293, 175,816) |
12. Прогнозирование эндогенной переменной
Оценим прогноз по модели (2), используя полученные прогнозные значения X
— прогноз значения эндогенной переменной для момента
)
Подставив прогнозные значения в модель (2), получим точечный прогноз
:
Получим:
Для 95% доверительных интервалов, t(46, 0,025) = 2,013
Набл. |
Y |
Предсказание |
Ст. ошибка |
95% доверительный интервал |
2021:1 |
не определено |
25963,0 |
4578,78 |
(16746,4, 35179,6) |
2021:2 |
не определено |
29380,4 |
4580,36 |
(20160,6, 38600,2) |
На последующие два квартала 2021 года имеем значения среднедушевых доходов в размере 25963 и 29380,4 рублей соответственно.
Имя файла: var27.rar
Размер файла: 460.67 Kb
Если закачивание файла не начнется через 10 сек, кликните по этой ссылке