Пример решения эконометрической задачи в Statistica

Ниже приведено условие задачи и текстовая часть решения.  Все решение полностью, в архиве rar, вы можете скачать. Некоторые символы могут не отображаться на странице, но в архиве в формате doc все отображается. Закачка решения начнется автоматически через 10 секунд. Если закачка не началась, кликните по этой ссылке. Еще примеры решения задач по эконометрике можно посмотреть  здесь.

Задача 1. Построение и анализ линейной множественной регрессии

В таблице 1.1. приведены ежегодные данные о совокупных личных расходах; располагаемых личных доходах; расходах на табак для США на период с 1959 по 1983 годы. Оцените множественную регрессию между регрессандом (эндогенной переменной) Var1 и регрессорами (экзогенными переменными) Var2, Var3 и Var4 используя данные за 25 лет. Дайте интерпретацию коэффициентам регрессии. Исследуйте степень корреляционной зависимости между переменными. Проверьте остатки на  наличие автокорреляции и гетероскедастичность.      

Таблица 1.1.

Ежегодные данные о потребительских расходах и

располагаемых личных доходах для США на период с 1959 по 1983 годы

Вариант 1

Регрессант Var1

Регрессор Var2

Регрессор Var3

Регрессор Var4

Год

расходы на

отдых

(TPE)

время

(TIME)

личный

доход

(PI)

расходы на

табак

(TOB)

1959

440,4

1

544,9

10,7

1960

152

2

559,7

10,9

1961

461,4

3

575,4

11,2

1962

482

4

602,0

11,2

1963

500,5

5

622,9

11,4

1964

528

6

658,0

11,3

1965

557,5

7

700,4

11,6

1966

585,7

8

740,6

11,7

1967

602,7

9

774,4

11,8

1968

634,4

10

816,2

11,7

1969

657,9

11

853,5

11,4

1970

672,1

12

876,8

11,7

1971

696,8

13

900,0

11,8

1972

737,1

14

951,4

12,2

1973

768,5

15

1007,9

12,8

1974

763,6

16

1004,8

13

1975

780,2

17

1010,8

12,9

1976

823,1

18

1056,2

13,7

1977

864,3

19

1105,4

13,1

1978

903,2

20

1162,3

13,5

1979

927,6

21

1200,7

13,7

1980

931,8

22

1209,5

13,6

1981

950,9

23

1248,6

14

1982

963,3

24

1254,4

13,7

1983

1009,2

25

1284,6

13

Среднее знач.

707,184

13

908,856

12,304

 

 

Помощь на экзамене онлайн

 

Решение.

Используем пакет Statistica 6.0, модуль Множественная регрессия.

Создадим новый документ с данными, введем число переменных – 4 и число регистров – 25. Введем наименования переменных и исходные данные.

Вызовем модуль Множественная регрессия. (Команда Статистика®Множественная регрессия). Выберем переменные (кнопка (Variables). Зависимая (Dependent) – Var1; независимые (Independent) – Var2, Var3, Var4.

Нажмем кнопку ОК в правом углу стартовой панели.

Появится окно результатов множественной регрессии.

Результаты множественной регрессии в численном виде представлены в табл. 1.2.

Таблица 1.2.

 

 

Таблица 1.3.

 

 

В первом столбце таблицы 1.2. даны значения коэффициентов beta — стандартизованные коэффициенты регрессионного уравнения, во втором — стандартные ошибки beta, в третьем – В – точечные оценки параметров модели.

Далее, стандартные ошибки для коэффициентов модели В, значения статистик t-критерия и т.д.

Из таблицы 1.2. мы видим, что оцененная модель имеет вид:

         Var1 = 347,2 + 25,018∙Var2 – 0,0765∙Var3 – 3,755∙Var4  (1.1)

или

TPE = 347,2 + 25,018∙TIME – 0,0765∙PI – 3,755∙TOB                          (1.2)

   (t)   (0,738)    (1,073)           (0,1074)      (-0,107)

В верхней части таблицы 1.2. и в таблице 1.3. (а также в информационном окне) приведены следующие данные:

(easyhelp.su - помощь студентам в обучении)

Коэффициент множественной корреляции Multiple R = 0,9633;

Коэффициент детерминации R-square = 0,9279;

Скорректированный на поте­рю степеней свободы коэффициент множественной детерминации Adjusted R2 = 0,9176;

Критерий Фишера F = 90,107;

Уровень значимости модели р < 0,0000;

Стандартная ошибка оценки Std. Error of estimate = 59,293.

Проанализируем данные множественной регрессии.

Табличное значение критерия Стьюдента, соответствующее доверительной вероятности g = 0,95 и числу степеней свободы v = nm – 1 = 21;                  tкр. = t0,025;21 = 2,080.

Сравнивая расчетную t-статистику коэффициентов уравнения с табличным значением, заключаем, что все полученные коэффициенты статистически не значимы.

Уравнение (1.2.) выражает зависимость совокупных личных расходов (TPE) от времени (TIME), личного дохода (PI) и расходов на табак (TOB). Коэффициенты уравнения показывают количественное воздействие каждого фактора на результативный показатель при неизменности других. В нашем случае совокупные личные расходы увеличиваются на 25,017 ден. ед. при увеличении времени на 1 ед. при неизменности показателей личного дохода и расходов на табак; совокупные личные расходы увеличиваются на 0,0765 ден. ед. при увеличении показателя личного дохода на 1 ед. и неизменности показателей времени и расходов на табак; совокупные личные расходы уменьшаются 3,755 ден. ед. при увеличении расходов на табак на 1 ед. и неизменности показателей времени и личного дохода.

Множественный коэффициент корреляции построенной модели  (Multiple R) R = 0,9633 очень близок к единице, что говорит о высокой степени связи между исследуемыми факторами.

Коэффициент детерминации (R Square) R2 = 0,9279, что говорит о том, что 92,79% вариации переменной TPE объясняется вариацией переменных TIME, PI, TOB и только 7,21% приходятся на долю других неучтенных факторов.

Критическое (табличное) значение критерия Фишера для доверительной вероятности g = 0,95 и числа степеней свободы v1 = 253 = 22 и                        v2 = 25 – 1 = 24: Fкр. = F0,05;22;24 = 2,01.

Расчетное значение критерия Фишера F = 90,107 намного превышает табличное значение критерия Fтабл. = 2,01, что говорит о хорошем качестве построенной модели (модель адекватна экспериментальным данным). Уровень значимости p = 0,00000 показывает, что построенная регрессия высоко значима.

Исследуем степень корреляционной зависимости между переменными. Для этого построим корреляционную матрицу. Чтобы корреляционная матрица была построена при множественной регрессии, нужно установить флажок в строке Review descriptive statistics, correlations matrix в окне Multiple Regressions.

Помощь на экзамене онлайн

 

Корреляционная матрица приведена в таблице 1.4.

Таблица 1.4.

 

 

Из корреляционной матрицы следует, что на расходы на отдых все исследуемые факторы оказывают значительное и примерно одинаковое влияние (коэффициенты корреляции между Var1 и Var2, Var3, Var4 равны соответственно 0,99975; 0,94192; 0,96325). Из корреляционной матрицы также следует, что между факторами имеется мультиколлинеарность (коэффициенты корреляции между регрессорами Var2, Var3, Var4 также высоки и примерно одинаковы).

Проведем анализ остатков от регрессии.

Остатки представляют собой разности между наблюдаемыми значениями и модельными, то есть значениями, подсчитанными по модели с оцененными параметрами.

По кнопке Observed vs. residuals появится график (рис.1.1.), который говорит о неслучайном разбросе стандартных отклонений.

 

Рис. 1.1. Наблюдаемые переменные-остатки

 

Проверим остатки на  наличие автокорреляции. Для этого вычислим статистику Дарбина-Уотсона (Darbin-Watson Stat). Результаты вычисления статистики Дарбина-Уотсона приведены в табл. 1.5.

Таблица 1.5.

 

 

Из табл. 1.5 определяем наблюдаемое значение критерия Дарбина-Уотсона:

DW = 2,469.

По таблице приложения 4 [1] определяем значащие точки dL и dU для 5% уровня значимости.

(easyhelp.su - помощь студентам в обучении)

Для m = 3 и n = 25 dL = 1,123; dU = 1,654.

Так как   4 - dU <DW < 4 -  dL (2,346 < 2,469 < 2,877), то гипотезу об отсутствии автокорреляции мы не можем принять и не можем опровергнуть, так как значение статистики попало в зону неопределенности критерия.

Для проверки наличия гетероскедастичности воспользуемся тестом Парка. В Excel рассчитаем логарифмы значений e2, Var2, Var3 и Var4 (см. табл. 1.6).

Таблица 1.6.

lne2

lnVar2

lnVar3

lnVar4

8,3994

0,0000

6,3006

2,3702

11,0199

0,6931

6,3274

2,3888

7,2312

1,0986

6,3551

2,4159

6,8499

1,3863

6,4003

2,4159

6,3017

1,6094

6,4344

2,4336

6,2515

1,7918

6,4892

2,4248

6,4491

1,9459

6,5517

2,4510

6,4871

2,0794

6,6075

2,4596

5,4683

2,1972

6,6521

2,4681

5,8361

2,3026

6,7047

2,4596

5,1311

2,3979

6,7493

2,4336

0,8558

2,4849

6,7763

2,4596

-3,3961

2,5649

6,8024

2,4681

5,0783

2,6391

6,8579

2,5014

5,6643

2,7081

6,9156

2,5494

4,9611

2,7726

6,9125

2,5649

6,1080

2,8332

6,9185

2,5572

2,6630

2,8904

6,9624

2,6174

3,7059

2,9444

7,0080

2,5726

5,7141

2,9957

7,0582

2,6027

5,3628

3,0445

7,0907

2,6174

3,9650

3,0910

7,0980

2,6101

5,3713

3,1355

7,1298

2,6391

6,7246

3,1781

7,1344

2,6174

5,1164

3,2189

7,1582

2,5649

 

Построим для каждой объясняющей переменной зависимости .

Для этого модуль Множественная регрессия для переменных lne2; lnX1; lnX2; lnX3. Результаты в таблицах 1.7 – 1.9.

 

Таблица 1.7.

 

 

Таблица 1.8.

 

 

Таблица 1.9.

 

 

В таблицах 1.7 – 1.9 рассчитана t-статистика для каждого коэффициента b (графа t(23)):

b1: t1 = -2,881;

b2:  t2 = -2,227;

b3:   t3 = -1,381.

Определяем статистическую значимость полученных коэффициентов b. По таблице приложения 2 [1] находим табличное значение коэффициента Стьюдента для уровня значимости a = 0,05 и числа степеней свободы v = n – 2 = 23. ta/2; v = t0,025; 23 = 2,069.

Сравнивая рассчитанную t-статистику с табличной, получаем, что  коэффициенты b1 и b2  является статистически значимым. Это говорит о присутствии в модели гетероскедастичности.

Помощь на экзамене онлайн

 

 

 

 

Вывод:

Построенное уравнении регрессии (1.2), хотя и адекватно экспериментальным данным (имеет высокий коэффициент детерминации и значимую F-статистику), не может быть использовано в практических целях, так как оно имеет следующие недостатки:

коэффициенты при объясняющих переменных статистически незначимы; мультиколлинеарность (объясняющие переменные взаимно коррелированны между собой); в модели присутствует явление гетероскедастичности.

Перечисленные недостатки могут привести к ненадежности оценок, выводы по t- и F- статистикам, определяющим значимость коэффициентов регрессии и детерминации, возможно, неверны.

 

 

 

 

Задача 2. Системы одновременных уравнений и их идентификация.

 

Представить представленную ниже модель в приведенном виде и построить графы состояний для структурной и приведенной форм модели.

Что можно сказать об идентифицируемости модели?

Какие из переменных являются эндогенными, а какие из переменных являются экзогенными?

В моделях через εt и vt обозначены случайные члены.

 

Рассматривается модель «доход – потребление» вида:

сt =β0 + β1yt + β2 сt-1 + εt

it = γ0 + γ1 rt + vt

yt = сt + it + gt,

где    сt объем потребления;

it – объем инвестиций;

yt- доход;

rt – процентная ставка;

gt – объем государственных расходов в период t.

 

Решение.

В данной модели эндогенные (объясняемые) переменные:

сt объем потребления;

it – объем инвестиций;

yt- доход.

 

Экзогенные (объясняющие) переменные:

rt – процентная ставка,

gt – объем государственных расходов в период t;

сt-1 запаздывающая эндогенная переменная (объем потребления в предшествующий период).

 

Представим модель в приведенном виде. Для этого выразим эндогенные переменные через экзогенные.

yt = сt + γ0 + γ1 rt + vt + gt;

yt = β0 + β1yt + β2 сt-1 + εt + γ0 + γ1 rt + vt + gt;

yt(1 – β1) = β0 β2 сt-1 + εt + γ0 + γ1 rt + vt + gt;

 

 

Аналогично для переменной сt:

сt = β0 + β1сt + β1γ0 + β1γ1rt + β1vt + β1gt,+ β2сt-1 + εt

сt(1 – β1) = β0 + β1γ0 + β1γ1rt + β1vt + β1gt,+ β2сt-1 + εt

.

Модель в приведенном виде:

 

it = γ0 + γ1 rt + vt

 

Построим графы состояний для структурной и приведенной форм модели.

 SHAPE  \* MERGEFORMAT

ct

it

yt

rt

gt

сt-1

Эндогенные переменные

Экзогенные переменные

Рис.2.1. Граф состояний для структурной формы модели.

 SHAPE  \* MERGEFORMAT

ct

it

yt

rt

gt

сt-1

Эндогенные переменные

Экзогенные переменные

Рис.2.2. Граф состояний для приведенной формы модели.

 

Чтобы выяснить идентифицируемость уравнений модели проверим необходимые условия идентифицируемости:

1)    (N – n) + (M – m) ³ N – 1;

2)    M – m ³ n – 1;

где    N – число эндогенных переменных системы;

         М – число экзогенных либо переопределенных переменных системы;

n - число эндогенных переменных в уравнении;

m - число экзогенных переменных в уравнении.

 

В рассматриваемой модели N = 3; М = 3

 

Для первого уравнения n = 2; m = 1

1)    3 – 2 + 3 – 1 ³ 2 – условие выполняется;

2)    3 – 1 ³ 2 – 1 – условие выполняется.

Первое уравнение идентифицируемо.

 

Для второго уравнения n = 1; m = 1

1)    3 – 1 + 3 – 1 ³ 2 – условие выполняется;

2)    3 – 1 ³ 1 – 1 – условие выполняется.

Второе уравнение идентифицируемо.

 

Для третьего уравнения n = 3; m = 1

1)    3 – 3 + 3 – 1 ³ 2 – условие выполняется;

2)    3 – 1 ³ 3 – 1 – условие выполняется.

Третье уравнение идентифицируемо. Так как для третьего уравнения при проверке условий получаются равенства, то третье уравнение идентифицировано точно.

 

Вывод: рассматриваемая модель идентифицируема.

 

Помощь на экзамене онлайн

 

Задача 3. Анализ временных рядов и прогнозирование

 

  1. Построить график временного ряда.
  2. Подобрать модель авторегрессии – скользящего среднего ARMA(p,q) к данному ряду, оценить ее параметры.
  3. Проверить качество модели и степень ее адекватности реальным данным с помощью анализа остатков
  4. На основе наблюдаемых значений провести прогноз на несколько периодов вперед.
  5. Провести экспоненциальное сглаживание данного временного ряда с целью проведения прогноза.
  6. Сравнить результаты прогнозирования, проведенные двумя способами.
  7. В качестве временного ряда предлагается динамика дефлятора цен для личных потребительских расходов (1972 г – 100%) таблица 3.1. – расходы на местный бензин.

 

Таблица 3.1.

Динамика дефлятора цен для потребительских расходов на бензин

 

Год

PGASO

1959

82,2

1960

84,5

1961

83,9

1962

84,5

1963

84,5

1964

84,4

1965

87,5

1966

89,5

1967

92,4

1968

93,8

1969

97

1970

97,9

1971

98,7

1972

100

1973

109,4

1974

147,7

1975

157,7

1976

164,3

1977

173,7

1978

181,3

1979

243,2

1980

337,9

1981

376,4

1982

356,6

1983

344,9

Среднее знач.

154,156

 

Решение.

Для построения модели авторегрессии–скользящего среднего ARMA(p,q) воспользуемся пакетом STATISTICA 6.0.

Построим модель ARMA(1,1), руководствуясь тем, что сравнивая коэффициенты корреляции уровней ряда yt и yt-1, yt и yt-2, yt и yt-3, yt и yt-4, наиболее высокий коэффициент корреляции (0,9698) оказался между уровнями yt и yt-1 (коэффициенты корреляции вычисляем с помощью функции Excel КОРРЕЛ).

В пакете STATISTICA используем раздел:

Дополнительные линейные/нелинейные модели ® Прогноз/серия времени.

Исходный ряд нестационарный (рис.3.1).

 

 

Рис.3. SEQ Рисунок \* ARABIC 1.

 

Выполним преобразования ряда, чтобы получить стационарный ряд. Для этого используем преобразование Differencing (x=x-x(lag)) с лагом 1. (рис.3.2).

 

Рис. 3.2.

 

Затем выбираем вкладку “ARIMA & autocorrelations functions” и устанавливаем следующие параметры: р = 0; Р = 0; q =1; Q = 0.

Метод оценивания выбираем Приближенный (Approximate).

В подокне Variables — Переменные высвечиваем исходный временной ряд и запускаем процедуру оценивания.

(easyhelp.su - помощь студентам в обучении)

Результаты оценки параметров модели представлены на рис.3.3.

 

 

Рис.3.3. Таблица оценок параметров ARIMA

 

В первой колонке этой таблицы - оценки параметров, во второй – асимптотическая стандартная ошибка, в третьей - значения t-критерия, в четвертой - уровни значимости, в пятой и шестой - соответственно верхние и нижние границы 95% доверительных интервалов для соответствующих неизвестных параметров модели.

В нашем случае интервал (-1,1034; -0,7471) с вероятностью 0,95 накрывает истинное значение параметра q(l). Число -0,9253, приведенное в первой колонке, есть точечная оценка неизвестного параметра q(l).

Оценим качество модели или степень ее адекватности данным с помощью анализа остатков. В окне Результаты посмотрим графики остатков ряда (рис.3.4).

 

 

Рис.3.4. График остатков ряда

 

 

На рис.3.5. показана гистограмма остатков. Распределение остатков похоже на нормальное.

 

Рис.3.5. Гистограмма остатков

 

Проверим, есть ли зависимость между остатками. Для этого воспользуемся процедурой Автокорреляции остатков.

На рис.3.6 приведены результаты автокорреляции остатков. Наибольшие коэффициенты корреляции (-0,248 и 0,211) наблюдается между значениями с лагом 3 и значениями с лагом 6. Однако эти коэффициенты недостаточно высокие. Можно считать, что остатки практически некоррелированы.

 

 

Рис.3.6. Анализ автокорреляции остатков модели

 

Итак, полученная модель достаточно адекватно описывает наблюдаемый временной ряд.

Построим прогноз на последующие 10 периодов (уровень доверия возьмем 0,9). Результаты прогноза представлены на рис.3.7 – 3.8.

 

 

Рис.3.7. Прогнозные значения на 10 периодов

 

 

Рис.3.8. График прогнозных значений

 

Проведем экспоненциальное сглаживание ряда.

Для этого также воспользуемся пакетом STATISTICA 6.0.

В разделе «Дополнительные линейные/нелинейные модели ® Прогноз/серия времени» переходим на вкладку «Exponential smoothing & forecasting»

Ряд не имеет сезонной составляющей, поэтому выбираем несезонное экспоненциальное сглаживание.

Для выполнения экспоненциального сглаживания необходимо определить параметры сглаживания a и g, значения которых находятся в диапазоне    (-1; 1).

Выберем Поиск на сетке лучших параметров (Grid Search for best parameters) и система определит лучшие значения параметров. Получаем лучшие параметры: a = 0,9 и g = 0,9.

Устанавливаем эти параметры и выполняем экспоненциальное сглаживание.

Результаты экспоненциального сглаживания представлены ниже.

Помощь на экзамене онлайн

 

 

Рис.3.9. Результаты экспоненциального сглаживания

 

Таблица 3.2.

Суммы ошибок

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 3.3.

Наблюдаемые значения, сглаженные значения, остатки,

прогнозные значения на 10 периодов вперед

 

 

 

На рис.3.9 представлены графики экспериментальных значений и сглаженных данных с прогнозом на 10 периодов. В таблице 3.2 представлены суммы ошибок. Например, сумма квадратов отклонений равна 15239,3. А в таблице 3.3 представлены наблюдаемые значения, сглаженные значения, остатки, а также прогнозные значения на 10 периодов вперед.

Сравнивая результаты прогнозирования, проведенные двумя способами, приходим к выводу, что прогнозная кривая, полученная по методу экспоненциального сглаживания, имеет тенденцию спада, а кривая модели скользящего среднего стабильна во времени. Иными словами прогнозные значения в обоих случаях разные, в первом случае прогнозные значения уменьшаются с течением времени, а во втором случае они остаются неизменными.

 

 

 

 

 

 

 

Список использованных источников.

 

1. Практикум по эконометрике. Под редакцией И. И. Елисеевой - М.: Финансы и статистика., 2007. - 343 с.

2. Доугерти К. Введение в эконометрику. - М.: МГУ, 1999. - 402 с.

3. Орлов А.И. Эконометрика. – М.: Экзамен, 2002.

4. Валентинов В.А. Эконометрика. – М.: «Дашков и Ко», 2006.

5. Тихомиров Н.П., Дорохина Е.Ю. Эконометрика. – М.: Экзамен, 2003.

6. Крамер Н. Ш., Путко Б. А. Эконометрика. – М.: ЮНИТИ-ДАНА, 2005.


Имя файла: Statistica.rar
Размер файла: 270.3 Kb

Если закачивание файла не начнется через 10 сек, кликните по этой ссылке