Построение уравнения множественной регрессии со всеми факторами матричным методом и с помощью надстройки «Анализ данных» MS Excel.

Ниже приведены условия задач, и текстовый отчет о решении. Закачка полного решения(документы  doc и xlsx в архиве rar) начнется автоматически через 10 секунд. 

Классическая линейная модель множественной регрессии

Цель работы

Изучить основные методы построения КЛММР и ее использования.

Исходные данные

Y

X1

X2

X3

1

39

179,2

646,22

50

2

28

16,92

281,45

35

3

35

100,94

320,22

49

4

45

625,93

1321,02

51

5

25

7,74

157,8

40

6

28

58,56

279,81

46

7

45

394,1

380,93

46

8

73

354,7

18,89

54

9

70

217,5

26,04

61

10

59

696,75

193,91

58

11

48

981,86

678,65

63

12

43

310,7

802,89

55

13

67

235,95

121,06

51

14

33

60,67

225,41

44

15

72

372,68

44,41

57

16

43

90,89

364,09

60

17

47

645,99

600,11

58

18

48

476,22

384,74

64

19

84

344,93

15,4

47

20

63

227,1

149,89

50

21

60

516,74

696,3

41

22

63

502,08

206,96

33

23

43

645,12

594,97

48

24

41

198,62

341,34

50

25

69

570,16

21,39

46

26

49

576,68

559,13

46

27

28

0,3

318,82

33

28

72

337,6

4,91

41

29

64

727,92

246,9

49

30

64

494,49

11,89

65

31

65

239,16

41,26

46

32

54

532,9

218,7

47

33

28

35,79

216,17

39

 

 

 

Ход работы

1) Построим уравнение множественной регрессии со всеми факторами матричным методом и с помощью надстройки «Анализ данных» ППП MS Excel.

Матричный метод

Определим вектор оценок коэффициентов регрессии. Согласно методу наименьших квадратов, вектор s получается из выражения:
К матрице с переменными
 добавляем единичный столбец:

Сначала умножаем транспонированную матрицу на у:

Потом также умножаем транспонированную матрицу на х :

;  

Находим обратную к полученной матрице:

 

Уравнение регрессии в матричном виде тогда будет иметь вид:

Оценка дисперсии равна:

Уравнение регрессии в скалярном виде:

 

 

Построение модели с помощью надстройки «Анализ данных» ППП MS Excel

Для построения уравнения линейной регрессии используем функцию «Данные»  «Анализ данных»  «Регрессия» табличного процессора MS Excel

Уравнение множественной регрессии имеет вид:

Оценка дисперсии равна:


3) Проверка факторов на наличие коллинеарности. Отбор неколлинеарных факторов.

Построим корреляционную матрицу, используя функцию «Данные»  «Анализ данных»  «Корреляция» табличного процессора MS Excel.

Проводим анализ коэффициентов корреляции

– связь прямая и умеренная;

 – связь обратная и умеренная;

 – связь прямая и слабая;

 – связь прямая и умеренная;

 – связь прямая и умеренная;

 – связи практически нет.

Ни один коэффициент межфакторной корреляции не превышает 0,6, следовательно, мультиколлинеарности не наблюдается.

Значение коэффициента корреляции между Y и Х3 незначительно, связь слабая следовательно, фактор Х3 признается незначимым.

4) Оценка качества модели

Определение значений коэффициента множественной корреляции и коэффициента детерминации.

Значения берем из протокола регрессионного анализа:. Связь результативного признака Y со всеми факторными признаками  высокая.

Коэффициент детерминации равен . Следовательно, 54,45% вариации признака Y объясняется вариацией признаков Х1, Х2, и Х3, остальные 45,55% вариацией других признаков, не включенных в модель.

Проверка значимости уравнения при заданном уровне значимости.

Значения берем из протокола дисперсионного анализа

Значимость уравнения проверим с помощью критерия Фишера:

Табличное значение при уровне значимости 5% и степенях свободы   равно:

Так как наблюдаемое значение критерия Фишера больше табличного, уравнение признается значимым.

Проверка значимости коэффициентов уравнения при заданном уровне значимости.

Значения берем из протокола регрессионного анализа

Для начала вычислим табличное значение t-статистики при уровне значимости 5%

и количестве степеней свободы 29: .

Находим t-статистики для параметров уравнения:

Параметр признается значимым, если значение его t-статистики больше табличного

 

Параметр

t-статистика по модулю

Сравнение

Значимость

a0

3,212259852

2,0452

Значим

b1

4,06560187

2,0452

Значим

b2

4,661201481

2,0452

Значим

b3

0,776781001

2,0452

Не значим

 

Доверительные интервалы для коэффициентов берем из протокола регрессионного анализа.

 

Нижние 95%

Верхние 95%

Y-пересечение

14,121695

63,618457

X1

0,018781

0,056805

X2

-0,049170

-0,019180

X3

-0,327751

0,729172

 

Из результата видно, что в доверительный интервал коэффициента при Х3 входит 0. Это еще раз подтверждает, что параметр не значим.

5) Определение частных коэффициентов эластичности.

 

·         при увеличении фактора Х1 на 1% результат Y увеличивается на 0,2626%;

·         при увеличении фактора Х2 на 1% результат Y уменьшается на 0,2115%;

·         при увеличении фактора Х3на 1% результат Y увеличивается на 0,1922%;

Максимальное значение коэффициента эластичности по модулю  следовательно, фактор Х1 оказывает наибольшее влияние на результат.

6) Построим и проанализируем другие модели с различным количеством регрессоров.

Построение уравнения линейной множественной регрессии с учетом только значимых факторов (Х1 и Х2).

Определим значения коэффициента множественной корреляции и коэффициента детерминации.

Коэффициент корреляции:. Связь результативного признака Y со всеми факторными признаками высокая.

Коэффициент детерминации . Следовательно, 53,5% вариации признака Y объясняется вариацией признаков  Х1 и Х2, остальные 46,5% вариацией других признаков, не включенных в модель.

Значимость уравнения проверим с помощью критерия Фишера:  . Табличное значение при уровне значимости 5% и степенях свободы  ; равно: .

Так как наблюдаемое значение критерия Фишера больше табличного, уравнение признается значимым.

Значимость коэффициентов уравнения при заданном уровне значимости.

Для начала вычислим табличное значение t-статистики при уровне значимости 5%  и количестве степеней свободы 30: . Находим t-статистики для параметров уравнения:

Параметр

t-статистика по модулю

Сравнение

Значимость

a0

12,81564892

2,0423

Значим

b1

4,803341495

2,0423

Значим

b2

4,738180035

2,0423

Значим

 

Построение уравнения парной линейной множественной регрессии с учетом значимого фактора Х1.

Определим значения коэффициента множественной корреляции и коэффициента детерминации.

Коэффициент корреляции: R=0,4325. Связь результативного признака Y с факторным умеренная.

Коэффициент детерминации . Следовательно, 18,7% вариации признака Y объясняется вариацией признаков  Х1, остальные 81,3% вариацией других признаков, не включенных в модель.

Значимость уравнения проверим с помощью критерия Фишера:  . Табличное значение при уровне значимости 5% и степенях свободы  ; равно: .

Так как наблюдаемое значение критерия Фишера больше табличного, уравнение признается значимым.

Значимость коэффициентов уравнения при заданном уровне значимости.

Для начала вычислим табличное значение t-статистики при уровне значимости 5%  и количестве степеней свободы 31: . Находим t-статистики для параметров уравнения:

Параметр

t-статистика по модулю

Сравнение

Значимость

a0

9,154807502

2,0395

Значим

b1

2,670623404

2,0395

Значим

 

 

Построение уравнения парной линейной множественной регрессии с учетом значимого фактора Х2.

Определим значения коэффициента множественной корреляции и коэффициента детерминации.

Коэффициент корреляции:. Связь результативного признака Y с факторным умеренная.

Коэффициент детерминации . Следовательно, 17,74% вариации признака Y объясняется вариацией признаков  Х2, остальные 82,26% вариацией других признаков, не включенных в модель.

Значимость уравнения проверим с помощью критерия Фишера:  . Табличное значение при уровне значимости 5% и степенях свободы  ; равно: .

Так как наблюдаемое значение критерия Фишера больше табличного, уравнение признается значимым.

Значимость коэффициентов уравнения при заданном уровне значимости.

Для начала вычислим табличное значение t-статистики при уровне значимости 5%  и количестве степеней свободы 31: . Находим t-статистики для параметров уравнения:

Параметр

t-статистика по модулю

Сравнение

Значимость

a0

15,23411078

2,0395

Значим

b1

2,585635383

2,0395

Значим

 

8) Составим сравнительную таблицу моделей

Регрессия

Коэффициент корреляции

Коэффициент детерминации

F-критерий Фишера

Значимость параметров

a0

b1

b2

b3

Y(X1;X2;X3)

0,7379

0,5350

11,5549

Значим

Значим

Значим

Не значим

Y(X1;X2)

0,7314

0,5350

17,2589

Значим

Значим

Значим

-

Y(X1)

0,4325

0,1870

7,1322

Значим

Значим

-

-

Y(X2)

0,4212

0,1774

6,6855

Значим

Значим

-

-

 

Из таблицы видно, что наибольшее коэффициента официанта корреляции у модели со всеми факторами. Однако параметрам b3 в ней не значим. Поэтому наилучшей моделью признаётся уравнение с факторными переменными Х1 и Х2. У нее и также высокие коэффициенты корреляции и детерминации, наибольший критерий Фишера и все параметры значимы.

Интерпретация параметров модели Y(X1;X2) :

При увеличении фактора X1 на единицу результат Y увеличивается на 0,407.

При увеличении фактора X2 на единицу результат Y уменьшается на 0,0345.

9) Выполним прогноз

Для прогноза задаем вектор прогноза:

;

Точечный прогноз: 

Ошибка прогноза:

;    

Умножаем матрицы  и :

 

Умножаем полученную матрицу на , находим:

Оценка дисперсии равна:

Несмещенная оценка дисперсии равна:


Оценка среднеквадратичного отклонения:

Доверительный интервал с вероятностью 0,95 для значения результативного признака: , где  находим по таблице Стьюдента.

Доверительный интервал:

или

C вероятностью 0.95 среднее значение при  находится в указанных пределах.

Доверительный интервал с вероятностью 0,95 для индивидуального значения результативного признака.

Доверительный интервал:

или

C вероятностью 0,95 индивидуальное значение при находится в указанных пределах.

 

 

 

Список литературы

1.      Доугерти К. Введение в эконометрику: Пер. с англ. – М.: ИНФРА-М, 2003. – 402 с.

2.      Кремер Н.Ш., Путко Б.А. Эконометрика: Учебник для вузов / Под ред. проф. Н.Ш. Кремера. – М.: ЮНИТИ-ДАНА, 2010. – 311 с.

3.      Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс: Учебник. – М.: Дело, 2007. – 400 с.

4.      Эконометрика: Учебник / Под ред. И.И. Елисеевой. – М.: Финансы и статистика, 2007. – 344 с.

5.      Эконометрика: Учебно-методическое пособие / Шалабанов А.К., Роганов Д.А. – Казань: ТИСБИ, 2005. – 56 с.

Имя файла: excel.rar

Размер файла: 235.28 Kb

Если закачивание файла не начнется через 10 сек, кликните по этой ссылке