以下为《上机实验四多重共线性》的无排版文字预览,完整格式请下载
下载前请仔细阅读文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。
实验四 多重共线性
【实验目的】
掌握多重共线性的检验及处理方法
【实验内容】
建立并检验我国钢材产量预测模型
【实验步骤】
年份
国内旅游总花费(亿元)Y
国内游客
城镇居民人均旅游花费(元)X3
农村居民人均旅游花费(元)X4
铁路里程(万公里)X5
(百万人次)X2
1994
1023.5
524
414.7
54.9
5.90
1995
1375.7
629
464.0
61.5
5.97
1996
1638.4
639
534.1
70.5
6.49
1997
2112.7
644
599.8
145.7
6.60
1998
2391.2
695
607.0
197.0
6.64
1999
2831.9
719
614.8
249.5
6.74
2000
3175.5
744
678.6
226.6
6.87
2001
3522.4
784
708.3
212.7
7.01
2002
3878.4
878
739.7
209.1
7.19
2003
3442.3
870
684.9
200.0
7.30
2004
4710.7
1102
731.8
210.2
7.44
2005
5285.9
1212
737.1
227.6
7.54
2006
6229.7
1394
766.4
221.9
7.71
2007
7770.6
1610
906.9
222.5
7.80
2008
8749.3
1712
849.4
275.3
8.00
2009
10183.7
1902
801.1
295.3
8.60
2010
12579.8
2103
883.0
306.0
9.10
2011
19305.4
2641
877.8
471.4
9.30
2012
22706.2
2957
914.5
491.0
9.76
2013
26276.1
3262
946.6
518.9
10.31
2014
30311.9
3611
975.4
540.2
11.18
2015
34195.1
4000
985.5
554.2
12.10
2016
39390.0
4440
1009.1
576.4
12.40
一、检验多重共线性
⒈相关系数检验
利用相关系数可以分析解释变量之间的两两相关情况。在Eviews软件中可以直接计算相关系数矩阵。
本例中,在Eviews软件命令窗口中键入:
COR y x2 x3 x4 x5
或在包含所有解释变量的数组窗口中点击View\Correlations,其结果如图1所示。由相关系数矩阵可以看出,解释变量之间的相关系数均为0.93以上,即解释变量之间时高度相关的。
图1 解释变量相关系数矩阵
⒉辅助回归方程检验
当解释变量多余两个且变量之间呈现出较复杂的相关关系时,可以通过建立辅助回归模型来检验多重共线性。本例中,在Eviews软件命令窗口中键入:
LS X2 C X3 X4 X5
LS X3 C X2 X4 X5
LS X4 C X2 X3 X5
LS X5 C X2 X3 X4
对应的回归结果如图2-6所示。
图2
图3
图4
图5
上述每个回归方程的F检验值都非常显著,方程回归系数的T检验值表明:X2与X3,x4,x3和x2,x4和x2,x5,x5和x4 T检验值较小,这些变量之间可能不相关或相关程度较小。
3.方差膨胀因子检验
从以上辅助回归模型可知,VIF2=35.91854、VIF3=129.30895、VIF4=53.55111、VIF5=141.0516都远远大于10,解释变量X2、X3、X4、X5之间存在较为严重的多重共线性。
下面利用Eviews9.0软件直接计算解释变量的方差膨胀因子,在Equation回归结果中单击View/Coefficient Diagnostics/Variance Inflation Factors即可,其中Centered VIF即为方差膨胀因子(VIF),如下图所示:
二、利用逐步回归方法处理多重共线性
⒈建立基本的一元回归方程
根据相关系数和理论分析,钢材产量与生铁产量关联程度最大。所以,设建立的一元回归方程为:
⒉逐步引入其它变量,确定最适合的多元回归方程(回归结果如表2所示)
表2 钢材产量预测模型逐步回归结果
模型
X1
X2
X3
X4
X5
Y=f(X1)
0.9214 (56.807)
0.9949
0.9941
Y=f(X1,X2)
0.4159 (3.5394)
0.4872 (4.3234)
0.9974
0.9970
Y=f(X1,X3)
0.959 (14.185)
0.0249 (-0.5738)
0.9950
0.9940
Y=f(X1,X4)
0.9414 (13.025)
-0.0025 (-0.2846)
0.9945
0.9938
Y=f(X1,X5)
0.8578 (20.229)
0.0084 (-0.2846)
0.9919
0.9910
Y=f(X1,X2,X3)
0.405 (2.835)
0.491 (4.1225)
0.0046 (0.1424)
0.9969
0.9974
Y=f(X1,X2,X4)
0.4433 (3.4857)
0.4911 (4.2748)
-0.0039 (-0.6347)
0.9969
0.9974
Y=f(X1,X2,X5)
0.4073 (3.1797)
0.5025 (3.6357)
-0.001 (-0.2041)
0.9969
0.9974
所以,建立的多元回归模型为:
Y = -287.6867 + 0.4159*X1 + 0.4872*X2
3.下面利用Eviews9.0软件直接采用逐步回归法解决我国钢材产量预测模型存在的多重共线性问题。
在主窗口,选择Quick/Estimate Equation,弹出方程设定对话框,通过估计方法的下拉选单选择逐步最小二乘法(STEPIS-Stepwise Least Squares),EViews将显示逐步最小二乘法的设定(Specification)标签页,如图7所示。
图7
逐步回归采用列表式进行变量的基本设定。在第一个编辑区域,首先设定被解释变量,在第二个编辑区域,输入设定解释变量。本例在第一个设定框内输入“Y C”,在第二个框内输入“ X1 X2 X3 X4 X5”,然后,可以利用选项(Options)标签页来控制逐步回归具体采用的方法。
打开选项(Options),见图8。其中选择模型(Selection Method)部分用来设定逐步回归的方法,包括单向逐步回归法(Uni-direct.ional)、有进有出逐步回归法(Stepwise)、交换逐步回归法(Swapwise)和组合逐步回归法(Combinatorial)。EViews9.0默认使用前向有进有出(Stepwise-forwards)法。若想改变这个基本方法,在下拉选单中可以更换其他方法。
图8
对于本案例,在Selection Method部分,采用默认的前向有进有出法(Stepwise-Forwards),在Stopping Criteria(程序终止准则)区,选择显著性水平p-value(或t-stat),右边的方框填写0.05(或2),选择“利用回归变量的个数” (Use number of regressors)选项,将默认值l改为5,其余采用默认设置,得到估计结果如表3所示。
表3 有进有出逐步回归结果(Stepwise-Forwards)
所以,建立的我国钢材产量预测模型为:
Y = -287.6867 + 0.4159*X1 + 0.4872*X2
t = (-2.8418) (3.5393) (4.3234)
=0.9974 =0.997 DW=0.6925 F=3208.727
以上为《上机实验四多重共线性》的无排版文字预览,完整格式请下载
下载前请仔细阅读上面文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。