多重共线性分析:
输入命令cor y date x4 x5 d1 d2 d3 d4
|
Y |
DATE |
X4 |
X5 |
D1 |
D2 |
D3 |
D4 |
Y |
1.0000 |
0.9963 |
0.9934 |
0.9892 |
0.3040 |
0.8998 |
-0.1518 |
-0.1552 |
DATE |
0.9963 |
1.0000 |
0.9975 |
0.9928 |
0.3034 |
0.9165 |
-0.1393 |
-0.1614 |
X4 |
0.9934 |
0.9975 |
1.0000 |
0.9886 |
0.2713 |
0.9174 |
-0.1320 |
-0.1427 |
X5 |
0.9892 |
0.9928 |
0.9886 |
1.0000 |
0.3631 |
0.9445 |
-0.1668 |
-0.1727 |
D1 |
0.3040 |
0.3034 |
0.2713 |
0.3631 |
1.0000 |
0.4526 |
-0.2160 |
-0.1698 |
D2 |
0.8998 |
0.9165 |
0.9174 |
0.9445 |
0.4526 |
1.0000 |
-0.1403 |
-0.1287 |
D3 |
-0.1518 |
-0.1393 |
-0.1320 |
-0.1668 |
-0.2160 |
-0.1403 |
1.0000 |
0.8450 |
D4 |
-0.1552 |
-0.1614 |
-0.1427 |
-0.1727 |
-0.1698 |
-0.1287 |
0.8450 |
1.0000 |
其中cov(date,x4)=0.9975,cov(date,x5)=0.9928 ,cov(x4,x5)=0.9886
说明date,x4,x5存在严重的多重共线性。
修正方法:去掉其中一个变量。具体如下:
输入命令ls y c date x5 d1 d2 d3 d4
得方程II为:
Y=-144101.5 + 992.8914date + 110.7844x5 + 2159.334D1 – 26418.98D2
(-3.85) (5.97) (1.97) (0.73) (3.89)
-1905.139D3 + 8764.124D4
(-2.35) (2.67)
R^2=0.996210 DW=
除了D1 的t统计不显著,其他指标很好~
输入命令ls y c date x4 d1 d2 d3 d4
得方程III为:
y=-210523 + 1373.49date – 48.98182x4 + 3456.501D1 –17227.65D2
(-11.59) (4.78) (-0.22) (0.92) (-2.84)
- 2380.564D3 + 9938.672D4
(-2.67) (2.63)
R^2=0.995629 DW=
X4,D1的t统计量不好。
输入命令ls y c x4 x5 d1 d2 d3 d4
得方程IV为:
Y=-103524.3 + 543.7763date + 213.7527x5 + 5815.153D1 - 39268.19D2
(-2.96) (5.25) (4.77) (1.65) (-5.98)
-794.8053D3 + 4377.135D4
(-0.95) (1.25)
R^2=0.995623 DW=
比较模型II,III,IV:
III的x4的t都不显著,不是很好的模型。
IV虽然date,x4的t统计显著了很多,但使d3,d4的t统计不显著,所以模型IV不是很理想。
所以在多重共线性分析中应该选模型II。
因为D1的t检念不显著,去掉D1分析有:
输入命令ls y c date x5 d2 d3 d4
得方程V为:
y=-131931.7 + 947.4899date + 123.5219X5 - 25759.27D2 -1906.967D3 + 8627.612D4
(-3.97) (6.20) (2.33) (-3.86) (-2.37) (2.65)
R^2=0.996129 DW=
评论