Пример решения эконометрической задачи в Gretl

Ниже приведено условие задачи и текстовая часть решения.  Все решение полностью, в архиве rar, вы можете скачать. Некоторые символы и рисунки могут не отображаться на странице, но в архиве в формате doc все отображается.Закачка решения начнется автоматически через 10 секунд. Если закачка не началась, кликните по этой ссылке. Еще примеры решения задач по эконометрике можно посмотреть  здесь.

Если хотите научиться решать эту задачу в Gretl самостоятельно - вот видеоурок.

Теоретический раздел.

 

              Построение эмпирического уравнения регрессии является начальным этапом эконометрического анализа. Первое же построенное по выборке уравнение регрессии очень редко является удовлетворительным по тем или иным характеристикам. Поэтому следующей задачей эконометрического анализа является проверка качества уравнения регрессии. В эконометрике принята устоявшееся схема такой проверки (по крайней мере на начальной стадии). Это нашло отражение почти во всех современных эконометрических пакетах.

               Проверка статистического качества оцениваемого уравнения регрессии проводится по следующим направлениям:

- проверка статистической значимости коэффициентов уравнения регрессии.

- проверка общего качества уравнения регрессии;

- проверка свойств данных, выполнимость которых предполагалась при оценивании уравнения (проверка выполнимости предпосылок МНК).

     Ведем понятие нулевая гипотеза. Нулевая гипотеза – это предположение о том, что две совокупности, рассматриваемые с точки зрения одного или нескольких признаков, одинаковы. При этом предполагается, что действительное значение равно нулю, а найденное из эксперимента отличие от нуля носит случайный характер.

Нулевые гипотезы проверяются с помощью статистичес­ких критериев.

Поскольку статистические критерии могут установить только отличие, но не одинаковость совокупностей относительно рассматриваемых признаков, то нуль-гипотеза, как правило, выдвигается для проверки, нет ли оснований для ее отбрасывая и принятия альтернативной гипотезы.

Проверка достоверности коэффициентов модели произ­водится с помощью статистического критерия Стьюдента.

        Шаг 1. Выдвигается нулевая гипотеза

H0:  ai = 0

 Шаг 2. Вычисляются ошибка коэффициента модели Sai.

 Шаг 3. Вычисляется фактическое значение критерия Стьюдента

t = bj/Sbj

        Шаг 4. Затем находится табличное значение критерия Стьюдента, соответствующее уровню значимости a и числу степеней свободы v = n – m – 1;  tкр. = ta/2; v.

Шаг 5. Сравниваются фактические значения критерия Стьюдента с его критическим значением ta/2.

Если |t| > ta/2(a = 0,05; m = n - k), то нулевая гипотеза отвергается с вероятностью 1-a и считается, что коэффи­циент ai достоверно отличается от нуля.

Если |t| < ta/2(a = 0,05; m = n - k), то нулевая гипотеза принимается и считается, что достоверность ai статистичес­ки не доказана.

Помощь на экзамене онлайн

 

Проверка достоверности модели производится с помощью статистического критерия Фишера.

Шаг 1. Выдвигается нулевая гипотеза

Н0: между рассматриваемыми переменными нет связи.

Шаг 2. Вычисляется фактическое значение критерия Фишера

F = Sрег2/ Sост2

Шаг 3. Определяется критическое значение критерия Фишера на уровне значимости a = 0,05, числе степеней сво­боды m1 и m2. Критическое значение критерия Фишера можно найти по таблицам, которые есть в каждом учебнике по эко­нометрике.

Критическое значение критерия Фишера имеет следую­щие параметры:

Fкp(a = 0,05; m1 = k - 1; m2 = n - k),

 где a — уровень значимости критерия;

m1 — число степеней свободы для большей дисперсии регрессии;

m2 — число степеней свободы для меньшей дисперсии остатков;

n — объем выборки;

к — количество всех коэффициентов модели.

Шаг 4. Сравниваются фактические значения критерия Фишера с его критическим значением.

Если F > FKp Fкp(a = 0,05; m1 = k - 1; m2 = n - k), то нулевая гипотеза отвергается с вероятностью 1- a и считает­ся, что модель является достоверной.

Если F < Fкp(a = 0,05; m1 = k - 1; m2 = n - k), то нулевая гипотеза принимается и считается, что достоверность модели не доказана, при этом не указывается вероят­ность этого утверждения.

Предложенный критерий Фишера проверки достовер­ности модели имеет существенный недостаток, который заключается в том, что он является внутренним критерием. При этом чем меньше ошибка модели, тем достовернее она становится. Это справедливо до того момента, когда модель описывает существующую тенденцию, при дальнейшем уменьшении ошибки модели уравнение регрессии будет проходить через случайные составляющие, что приведет к фактичес­кому увеличению ошибки прогноза.

Наличие автокорреляции в модели устанавливается с помощью статистики Дарбина-Уотсона. Схема нахождения статистики Дарбина-Уотсона:

    Шаг 1. Вычисляется критерий Дарбина – Уотсона

 

 
   
 

 

 

 

 

     Шаг 2. Определяются по таблицам нижнее и верхнее пороговые значения соответственно dн и dв, зависящие от числа измерений, уровня значимости и числа объясняемых факторов в модели.

     Шаг 3. Проверяются следующие условия:

1) если dв < DW < 4 – dв, то нулевая гипотеза об отсутствии автокорреляции принимается;

2) если dн £ DW £ dв или 4 – dв £ DW £ 4 – dн, то нулевая гипотеза об отсутствии автокорреляции не принимается и не отвергается (область неопределенности критерия);

3) если 0 < DW < dн, то нулевая гипотеза об отсутствии автокорреляции отвергается и утверждается, что имеется положительная автокорреляция остатков;

4) если 4 – dн < DW < 4, то нулевая гипотеза об отсутствии автокорреляции отвергается и утверждается, что имеется отрицательная остатков.

Так же наличие автокорреляции можно установить с помощью Q-статистики Льюинга-Бокса и теста на серийную автокорреляцию Бреуша-Годфрея.

Для проверки на наличие гетероскедастичности в модели можно воспользоваться рядом тестов, например тест Вайта, тест Парка и д. р. В нашем случае для проверки на гетероскедастичность мы будем пользоваться тестом Бреуша-Пагана.

Тест Бреуша — Пагана применяется в тех случаях, когда априорно предполагается, что дисперсии зависят от некоторых дополнительных переменных. Сначала проводится обычная (стандартная) регрессия и получается вектор остатков. Затем строится оценка дисперсии. Далее проводится регрессия квадрата вектора остатков деленного на эмпирическую дисперсию (оценку дисперсии). Для нее (регрессии) находят объясненную часть вариации. А для этой объясненной части вариации, деленной пополам, строится статистика. Если верна нулевая гипотеза (справедливо отсутствие гетероскедастичности), то эта величина имеет распределение χ2. Если же тест, напротив, выявил гетероскедастичность, то исходная модель преобразуется делением компонентов вектора остатков на соответствующие компоненты вектора наблюдаемых независимых переменных.

Тест Уайта предполагает, что дисперсия ошибок регрессии представляет собой квадратичную функцию от значений факторов, например при наличии 2-х факторов:

ε2 = a + b1x1 + b11x12 + b2x2 + b12∙x1∙x2.

 

   Так что модель включает в себя не только значения факторов, но и их квадраты, а так же попарные произведения. Поскольку каждый параметр модели εi2= f(xi) должен быть рассчитан на основе достаточного числа степеней свободы то чем меньше объем исследуемой совокупности, тем в меньшей мере квадратичная функция сможет содержать попарные произведения факторов.

     В настоящее время тест Уайта включен стандартную  программу регрессионного  анализа  в  пакете «Gretl». О наличии или отсутствии гетероскеда ности остатков судят по величине F-критерия Фишера для квадратичной функции регрессии остатков. Если фактическое значение F-критерия выше табличного, то, следовательно, существует четкая корреляционная связь дисперсии ошибок от значений факторов, включенных в регрессию, и имеет место гетероскедастичность остатков. В противном случае (Fфакт < Fтабл) делается вывод об отсутствии гетероскедастичности остатков регрессии.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Аналитический раздел.

 

   Значения исходных данных представлены в таблице 1.

Таблица 1.

Период

ВВП, % г/г

Экспорт, % г/г

Импорт, % г/г

ИПЦ, %, г/г к/п

2001q01

2

21,3

6,9

78

2001q02

5,2

17,1

6,3

65

2001q03

1,6

4,3

3,1

49

2001q04

7

-2,7

10

46

2002q01

3,7

-7

1,3

46

2002q02

5,5

8,4

2,9

44

2002q03

4

10,2

12,9

42

2002q04

6,2

24,1

19,4

35

2003q01

5,6

39,2

39

29

2003q02

4,8

20

29,8

29

2003q03

7,3

22,2

21,4

28

2003q04

8,8

25

24,6

25

2004q01

9,3

27,7

21,5

22

2004q02

11

36,9

43,1

18

2004q03

11,6

44,6

42,9

15

2004q04

11,6

42,2

53,4

14

2005q01

9,6

21,8

0,6

12

2005q02

8,3

17,4

3,3

10

2005q03

8,5

16,3

6,9

10

2005q04

10,7

11,5

-5,3

8

2006q01

11

27,5

51,3

6,8

2006q02

9,6

24,9

37

7

2006q03

8,6

29,3

30

6,4

2006q04

10,8

13,6

23,5

6,6

2007q01

8,4

6,3

20,8

8,1

2007q02

8,9

23,3

23,7

7,2

Период

ВВП, % г/г

Экспорт, % г/г

Импорт, % г/г

ИПЦ, %, г/г к/п

2007q03

8,4

19

23,7

9

2007q04

7,3

44,4

42,4

12,1

2008q01

10,9

69,2

56,5

13,2

2008q02

10,1

56

55,3

16

2008q03

11,2

44,9

53,1

16,3

2008q04

7,5

-11,6

-1,5

13,3

2009q01

1,1

-48,9

-31,7

15,5

2009q02

-0,4

-47,7

-33,4

13,4

2009q03

-0,3

-35,4

-37,2

11,7

2009q04

0,2

2,9

-1,7

10,1

2010q01

4

29,2

8,9

6,4

2010q02

6,6

18,9

18,1

6,9

2010q03

6,6

3,8

18,4

9

 

         Создадим файл с исходными данными в среде Microsoft Excel, затем импортируем данные в Gretl.

Исследуем степень корреляционной зависимости между переменными. Для этого построим корреляционную матрицу. Корреляционная матрица приведена в таблице 2.

Таблица 2.

 

 

Чем ближе коэффициент корреляции к единице, тем сильнее корреляционная зависимость между переменными. Наибольшее значение имеет коэффициент корреляции между величиной экспорта товаров и величиной импорта товаров, так же имеем высокие коэффициенты корреляции между величиной ВВП и величиной импорта, величиной ВВП и величиной экспорта.

Построим модель (1), в которой зависимой переменной является величина ВВП, а объясняемыми переменными будут – экспорт, импорт, индекс потребительских цен.

Результаты множественной регрессии в численном виде представлены в табл. 3, подробный отчет представлен в приложении 1.

Помощь на экзамене онлайн

 

Таблица 3.

 

   Как следует из данных, полученных  в gretl, многофакторная модель будет иметь вид:

 ВВП = 6,398 + 0,0404∙Эксп + 0,0663∙Имп - Ипц∙0,0613      (1)      

                  (t)    (9,881)       (1,216)              (1,892)          (-2,97)         

     Табличное значение критерия Стьюдента, соответствующее доверительной вероятности g = 0,95 и числу степеней свободы v = nm – 1 = 31;                  tкр. = t0,025;35 = 2,356.

Сравнивая расчетную t-статистику коэффициентов уравнения с табличным значением, заключаем, что не все коэффициенты регрессии в полученном уравнении является статистически значимым. Исключим незначимую переменную экспорта из уравнения регрессии.

Результаты множественной регрессии в численном виде представлены в табл. 4, подробный отчет представлен в приложении 2.

Таблица 4.

 

 

 

 

Модель будет иметь вид:

 ВВП =  6,323 +  0,1046∙Имп – 0,0575∙Ипц       (2)      

                            (t)      (9,745)       (6,836)           (-2,8)         

     Табличное значение критерия Стьюдента, соответствующее доверительной вероятности g = 0,95 и числу степеней свободы v = nm – 1 = 32;                  tкр. = t0,025;36 = 2,352.

Сравнивая расчетную t-статистику коэффициентов уравнения с табличным значением, заключаем, что все коэффициенты регрессии в полученном уравнении является статистически значимым.

Коэффициент детерминации так же имеет высокое значение и составляет 0,633.

Мы не проверили выполнение основных предпосылок метода наименьших квадратов – отсутствие в модели гетероскедастичности и автокорреляции остатков случайных отклонений. Наличие данных явлений может привести к неправильным оценкам коэффициентов уравнения регрессии, а как следствие к неверным выводам по оценки качества всего уравнения в целом.

Проверим остатки на  наличие автокорреляции. Для этого найдем значение  статистики Дарбина-Уотсона:

DW = 1,198.

По таблице приложения 4 [1] определяем значащие точки dL и dU для 5% уровня значимости.

Для m = 2 и n = 36: dL = 1,343; dU = 1,584.

Так как DW<dL  (1,198 < 1,343), то нулевую гипотезу об отсутствии автокорреляции мы не  можем принять.

    Проверим наличие автокорреляции, используя тест Бреуша-Годфри.  Тест основан на следующей идее: если имеется корреляция между соседними наблюдения­ми, то естественно ожидать, что в уравнении

, t = 1,…, n

(где et — остатки регрессии, полученные обычным методом наи­меньших квадратов), коэффициент ρ окажется значимо отли­чающимся от нуля.

Тест представлен в приложении 1. р-значение составляет 0,01, что меньше критического значения, которое составляет 0,05. Следовательно, в полученной модели присутствует автокорреляция остатков случайных отклонений.

Проверим наличие гетероскедастичности в модели, используя тест Уайта. Строим регрессию:

ε2 = a + b1x1 + b11x12 + b2x2 + b22x22+ b12∙x1∙x2

Данные результата теста представлены в приложении 2.

  Результаты теста Уайта показывают отсутствие  гетероскедастичности, так как Р-вероятность принятия гипотезы о гетероскедастичности составляет 0,054, что  больше 0,05.

Проверим наличие мультиколлинеарности, в модели (2).

 

 

Таблица 5.

 

Коэффициент корреляции между объясняющими переменными составляет -0,1549. Значение достаточно мало, оно так же намного меньше значений коэффициентов корреляции между ВВП и импортом (0,74), ВВП и ИПЦ (-0,3946). Следовательно, можем признать, что в полученной модели (2), мультиколлинеарность отсутствует.

Полученную модель (2) мы не можем признать удачной. Так как в данной модели присутствует автокорреляция остатков.

Помощь на экзамене онлайн.

Попробуем улучшить полученную модель (2), включив в неё переменную времени.

Результаты множественной регрессии в численном виде представлены в табл. 6.

Таблица 6.

 

   Модель будет иметь вид:

ВВП =  11,805 +  0,0877∙Имп – 0,1462∙Ипц – 0,1657·Врем.       (3)      

                (t)      (7,211)       (6,217)           (-4,777)         (-3,567)       

     Табличное значение критерия Стьюдента, соответствующее доверительной вероятности g = 0,95 и числу степеней свободы v = nm – 1 = 31;                  tкр. = t0,025;35 = 2,356.

Сравнивая расчетную t-статистику коэффициентов уравнения с табличным значением, заключаем, что все коэффициенты регрессии в полученном уравнении является статистически значимым.

Коэффициент детерминации  имеет высокое значение и составляет 0,7306.

Мы не проверили выполнение основных предпосылок метода наименьших квадратов – отсутствие в модели гетероскедастичности и автокорреляции остатков случайных отклонений. Наличие данных явлений может привести к неправильным оценкам коэффициентов уравнения регрессии, а как следствие к неверным выводам по оценки качества всего уравнения в целом.

Проверим остатки на  наличие автокорреляции. Для этого найдем значение  статистики Дарбина-Уотсона:

DW = 1,498.

По таблице приложения 4 [1] определяем значащие точки dL и dU для 5% уровня значимости.

Для m = 3 и n = 39: dL = 1,283; dU = 1,653.

Так как dL < DW < dU  (1,283 < 1,498 < 1,653), то нулевую гипотезу об отсутствии автокорреляции мы не  можем принять и не можем опровергнуть, так как значения попали в зону неопределенности критерия.

Проверим наличие автокорреляции, используя тест Бреуша-Годфри.

Тест представлен в приложении 3. р-значение составляет 0,174, что больше критического значения, которое составляет 0,05. Следовательно, в полученной модели отсутствует автокорреляция остатков случайных отклонений.

Проверим наличие гетероскедастичности в модели, используя тест Уайта.

Данные результата теста представлены в приложении 4.

  Результаты теста Уайта показывают отсутствие  гетероскедастичности, так как Р-вероятность принятия гипотезы о гетероскедастичности составляет 0,348, что  больше 0,05.

       Полученную модель (3) мы можем считать адекватной исходным данным, так как в модели все коэффициенты регрессии являются статистически значимыми, коэффициент детерминации имеет высокое значение. Предпосылки метода наименьших квадратов выполняются – в модели отсутствует автокорреляция и гетероскедастичность.

Построим график расчетных и наблюдаемых значений.

Рис. 1. Наблюдаемые и расчетные значения модели (3).

Видеоурок по решению этой задачи в Gretl.


Имя файла: Grelt.rar
Размер файла: 197.38 Kb

Если закачивание файла не начнется через 10 сек, кликните по этой ссылке