EViews. Видео урок 1. Построение модели множественной регрессии

Условие задачи и текстовый отчет приведены под видео. Закачка полного решения задачи с файлом EViews и отчётом начнется автоматически через 10 секунд.

Рассмотрены следующие вопросы: Экспорт данных данных из Excel в EViews. Построение модели множественной регрессии в EViews. Проверка условий Гаусса-Маркова. Проверка наличия автокорреляции с помощью статистики Дарбина-Уотсона (DW) и теста Бреуша-Годфри (Breusch-Godfrey serial correlation LM-test). Тесты на гетероскедастичность: тест Уайта (White test), тест Глeйзера (Glejser test), тест Бройша — Пагана (Breusch-Pagan test).

1

 

         По предложенным вам экспериментальным данным, представляющим собою макроэкономические показатели или показатели финансовой (денежно-кредитной) системы некоторой страны, т.е. случайной выборке объема n – построить математическую модель зависимости случайной величины Y от случайных величин X1 и X2. Построение и оценку качества экономико-математической (эконометрической) модели вести в следующей последовательности:
•Построить корреляционную матрицу для случайных величин и оценить статистическую значимость корреляции между ними.
•Исходя из наличия между эндогенной переменной и экзогенными переменными, линейной зависимости, оценить параметры регрессионной модели по методу наименьших квадратов. Вычислите вектора регрессионных значений эндогенной переменной и случайных отклонений.
•Найдите средние квадратические ошибки коэффициентов регрессии. Используя критерий Стьюдента проверьте статистическую значимость параметров модели. Здесь и далее принять уровень значимости 0,05(т. е. надежность 95%).
•Вычислите эмпирический коэффициент детерминации и скорректированный коэффициент детерминации. Проверьте, используя критерий Фишера, адекватность линейной модели.
•Установите наличие (отсутствие) автокорреляции случайных отклонений модели. Используйте для этого метод графического анализа, статистику Дарбина-Уотсона и критерий Бреуша-Годфри.
•Установите наличие (отсутствие) гетероскедастичности случайных отклонений модели. Используйте для этого графический анализ, тест Вайта и тест Парка для вариантов с добавочным индексом А (графический метод, тест Глейзера и тест Бреуша-Пагана для вариантов с добавочным индексом В).
•Обобщите результаты оценивания параметров модели и результаты проверки модели на адекватность.

Решение.

   В таблице 1.1. приведены ежеквартальные данные о валовом внутреннем продукте (млн. евро); количестве трудовых ресурсах (тыс. чел.); индексе потребительских цен (%) для Италии на период с 2000 по 2007 годы. 

Таблица 1.1.

Ежеквартальные данные о валовом внутреннем продукте, количестве трудовых ресурсов, индексе потребительских цен для Италии на период с 2000 по 2007 годы

 

Регрессант Y

Регрессор X1

Регрессор X2

Период

ВВП, млн. евро

(GDP)

Количество трудовых ресурсов, тыс. чел.

Индекс потребительских цен, %

2000q01

282366,3

16091

-3,2

2000q02

297344,5

16373

0,7

2000q03

293041,1

16584

0,3

2000q04

318305,2

16675

4,3

2001q01

298268,2

16456

-2,2

2001q02

313702,2

16625

1,1

2001q03

305916,9

16898

0,5

2001q04

330760,8

16965

5

2002q01

307135,3

17071

-2,7

2002q02

324543,4

17331

0,2

2002q03

319303,2

17553

0,9

2002q04

344243,5

17633

4,2

2003q01

317247,8

17529

-2,3

2003q02

332785,5

17926

0,8

2003q03

330902,7

18026

1,5

2003q04

354417,7

18214

3,7

2004q01

331731,4

17716

-2,7

2004q02

349982,4

18030

0,5

2004q03

342081,4

17967

-0,4

2004q04

367735

18147

4,4

2005q01

338094,1

18073

-3

2005q02

359008,2

18239

0,2

2005q03

351326,9

18233

-0,1

2005q04

379946,2

18391

6

2006q01

352919,3

18376

-5,1

2006q02

372487,5

18732

1,2

2006q03

362918,5

18629

-0,2

2006q04

391655,8

18651

4,5

2007q01

368921,4

18490

-2,8

2007q02

385325

18777

0,3

2007q03

377844,6

18983

0,3

2007q04

403449,3

19118

5,6

    Создадим файл с исходными данными в среде Microsoft Excel. Затем осуществим импорт данных в Eviews.

    Исследуем степень корреляционной зависимости между переменными. Для этого построим корреляционную матрицу. Корреляционная матрица приведена в таблице 1.2.

Таблица 1.2.

 

Из корреляционной матрицы следует, что на валовой внутренний продукт оказывает значительное влияние только регрессант Х1, т. е. количество трудовых ресурсов имеет корреляционную связь с валовым внутренним продуктом. Переменная Х2 имеет слабую связь с переменной Y, так как коэффициент корреляции между этими переменными очень мал. Так же можем отметить отсутствие корреляционной зависимости между объясняющими (экзогенными) переменными.

      Построим многофакторную регрессионную модель, в которой зависимая переменная – Y валовой внутренний продукт.

    Определим коэффициенты уравнения регрессии.

Y = 0 + 1X1 + 2X2

Результаты множественной регрессии в численном виде представлены в табл. 1.3.

Таблица 1.3

.

 

Как следует из данных, полученных с помощью Eviews методом наименьших квадратов, полученная многофакторная модель будет иметь вид:

Y = -250513,7 + 33,185X1 + 2618,7X2       (1.1)

                          (t)    (18,406)         (4,959)     (-7,828)

Уравнение (1.1) выражает зависимость валового внутреннего продукта (Y) от количества трудовых ресурсов (Х1), индекса потребительских цен (Х2). Коэффициенты уравнения показывают количественное воздействие каждого фактора на результативный показатель при неизменности других. В нашем случае валовой внутренний продукт увеличивается на 33,185 ед. при увеличении трудовых ресурсов на 1 ед. при неизменности показателя индекса потребительских цен; валовой внутренний продукт увеличивается на 2618,7 ед. при увеличении индекса потребительских цен на 1 ед. при неизменности показателя количества трудовых ресурсов. Случайное отклонение для коэффициента при переменной Х1 составляет 1,803; при переменной Х2 – 528; для свободного члена – 32003.

Табличное значение критерия Стьюдента, соответствующее доверительной вероятности = 0,95 и числу степеней свободы v = nm – 1 = 29;                  tкр. = t0,025;29 = 2,364.

Сравнивая расчетную t-статистику коэффициентов уравнения с табличным значением, заключаем, что все коэффициенты уравнения регрессии будут статистически значимыми.

Коэффициент детерминации R-square = 0,9337;

Скорректированный на поте­рю степеней свободы коэффициент множественной детерминации Adjusted R2 = 0,9291;

Критерий Фишера F = 204,2;

Уровень значимости модели р < 0,0000;

Согласно критерию Фишера данная модель адекватна. Так как уровень значимости модели меньше 0,00001.

Проверим остатки на  наличие автокорреляции. Для этого выпишем из таблицы 1.3 значение статистики Дарбина-Уотсона.

DW = 1,1706.

По таблице приложения 4 [1] определяем значащие точки dL и dU для 5% уровня значимости.

Для m = 2 и n = 32: dL = 1,28; dU = 1,57.

Так как DW < dL (1,1706<1,28), то нулевую гипотезу об отсутствии автокорреляции мы не можем принять.

Проверим наличие автокорреляции, используя тест Бреуша-Годфри.  Тест основан на следующей идее: если имеется корреляция между соседними наблюдения­ми, то естественно ожидать, что в уравнении

, t = 1,…, n

(где et — остатки регрессии, полученные обычным методом наи­меньших квадратов), коэффициент ρ окажется значимо отли­чающимся от нуля.

     Результаты теста представлены в таблице 1.4.

Таблица 1.4.

 

         Результаты теста Бреуша-Годфрея говорят о наличии в модели автокорреляции первого порядка. Мы можем ориентироваться на значения Р-вероятностей для коэффициентов лагов остатков во вспомогательной модели, которые так же указываются на их значимость, следовательно наличие в модели серийно корреляции, которую необходимо скорректировать. В нашем случае коэффициент при RESID(-1) является значимым. Это подтверждает наличие автокорреляции корреляции 1-го порядка.

        Установим наличие (отсутствие) гетероскедастичности случайных отклонений модели. Используйте для этого тест Глейзера и тест Бреуша-Пагана.

         Проверим наличие гетероскедастичности, используя тест Глейзера.

По данному методу оценивается регрессионная зависимость модулей отклонений от хi. При этом рассматриваемая зависимость моделируется следующим уравнением регрессии:

= + ∙Хik + vi

    Изменяя k можно построить различные уравнения регрессии. Обычно k = …, -1, -0,5, 0,5, 1, … В нашем случае возьмем k = 1. Статистическая значимость коэффициента в каждом конкретном случае фактически означает наличие гетероскедастичности.

    В Excel рассчитаем модули значений e (см. табл. 1.5).

Таблица 1.5.

ABS(e)

x1

x2

600,749

16091

-3,2

153,8632

16373

0,7

332,7871

16584

0,3

623,7009

16675

4,3

18,85068

16456

-2,2

360,7495

16625

1,1

239,0946

16898

0,5

139,0919

16965

5

715,0768

17071

-2,7

571,6753

17331

0,2

475,766

17553

0,9

70,97252

17633

4,2

274,9916

17529

-2,3

860,0992

17926

0,8

724,4499

18026

1,5

444,8954

18214

3,7

1039,256

17716

-2,7

502,2191

18030

0,5

1135,429

17967

-0,4

914,6239

18147

4,4

755,2764

18073

-3

100,5819

18239

0,2

511,8781

18233

-0,1

259,6149

18391

6

906,4768

18376

-5,1

1077,767

18732

1,2

221,7344

18629

-0,2

190,4953

18651

4,5

1205,802

18490

-2,8

1410,036

18777

0,3

750,8516

18983

0,3

1128,479

19118

5,6

 

Построим для каждой объясняющей переменной зависимости .

Результаты в таблицах 1.6– 1.7.

Таблица 1.6.

 

Таблица 1.7.

 

В таблицах 1.6 – 1.7 рассчитана t-статистика для каждого коэффициента .

Определяем статистическую значимость полученных коэффициентов . По таблице приложения 2 [1] находим табличное значение коэффициента Стьюдента для уровня значимости = 0,05 и числа степеней свободы v = n – 2 = 29. t/2; v = t0,025; 29 = 2,364.

Сравнивая рассчитанную t-статистику с табличной, получаем, что коэффициенты при переменных x1 и x2 не является статистически значимым. Это говорит об отсутствии в модели гетероскедастичности.

Проверим наличие гетероскедастичности в модели, используя тест Бреуша-Пагана. В соответствии с тестом Бреуша-Пагана действуем так:

1) Провели обычную регрессию и получили вектор остатков

2) Построим оценку , где = Sum squared resid = 1,98∙109.

= 1,98∙109 / 32 = 61875000

3) Проведем регрессию и найдем для нее объясненную часть вариации RSS.

 

 

 

 

 

Таблица 1.8

 

, где ESS = 65,479 и R2 = 0,0065 (данные из таблицы 1.8).

Отсюда, сначала найдем TSS = 65,479/(1-0,0065) = 65,907, а затем RSS 0,4298. RSS/2 0,2149, таким образом при нулевой гипотезе о наличии гомоскедастичности статистика RSS/2 имеет распределение Хи-квадрат распределение, р – количество переменных (у нас р=2). Критическая статистика на 5%-ном уровне значимости равна 5,99. Таким образом, 0,2149<5,99 и пороговое значение мы не превзошли. Следовательно, принимаем гипотезу о наличии гомоскедастичности, а гипотеза о наличии гетероскедастичности отвергается.

       Видим, что результат данного теста подтверждает результат теста Глейзера. 

Вывод:

Построенное уравнение регрессии (1.1), хотя и адекватно экспериментальным данным (имеет высокий коэффициент детерминации и значимую F-статистику, все коэффициенты регрессии статистически значимы), не может быть использовано в практических целях, так как оно имеет следующие недостатки: присутствует автокорреляция остатков случайных отклонений. Для использования данной модели необходимо скорректировать автокорреляцию случайных отклонений.

Имя файла: eviews_urok1.zip

Размер файла: 89.79 Kb

Если закачивание файла не начнется через 10 сек, кликните по этой ссылке