多重共线性分析: 输入命令cor y date x4 x5 d1 d2 d3 d4 Y DATE X4 X5 D1 D2 D3 D4 Y 1.0000 0.9963 0.9934 0.9892 0.3040 0.8998 -0.1518 -0.1552 DATE 0.9963 1.0000 0.9975 0.9928 0.3034 0.9165 -0.1393 -0.1614 X4 0.9934 0.9975 1.0000 0.9886 0.2713 0.9174 -0.1320 -0.1427 X5 0.9892 0.9928 0.9886 1.0000 0.3631 0.9445 -0.1668 -0.1727 D1 0.3040 0.3034 0.2713 0.3631 1.0000 0.4526 -0.2160 -0.1698 D2 0.8998 0.9165 0.9174 0.9445 0.4526 1.0000 -0.1403 -0.1287 D3 -0.1518 -0.1393 -0.1320 -0.1668 -0.2160 -0.1403 1.0000 0.8450 D4 -0.1552 -0.1614 -0.1427 -0.1727 -0.1698 -0.1287 0.8450 1.0000 其中cov(date,x4)=0.9975,cov(date,x5)=0.9928 ,cov(x4,x5)=0.9886 说明date,x4,x5存在严重的多重共线性。 修正方法:去掉其中一个变量。具体如下: 输入命令ls y c date x5 d1 d2 d3 d4 得方程II为: Y=-144101.5 + 992.8914date + 110.7844x5 + 2159.334D1 – 26418.98D2 (-3.85) (5.97) (1.97) (0.73) (3.89) -1905.139D3 + 8764.124D4 (-2.35) (2.67) R^2=0.996210 DW=1.430644 F=1095.327 除了D1 的t统计不显著,其他指标很好~ 输入命令ls y c date x4 d1 d2 d3 d4 得方程III为: y=-210523 + 1373.49date – 48.98182x4 + 3456.501D1 –17227.65D2 (-11.59) (4.78) (-0.22) (0.92) (-2.84) - 2380.564D3 + 9938.672D4 (-2.67) (2.63) R^2=0.995629 DW=1.776537 F=949.0410 X4,D1的t统计量不好。 输入命令ls y c x4 x5 d1 d2 d3 d4 得方程IV为: Y=-103524.3 + 543.7763date + 213.7527x5 + 5815.153D1 - 39268.19D2 (-2.96) (5.25) (4.77) (1.65) (-5.98) -794.8053D3 + 4377.135D4 (-0.95) (1.25) R^2=0.995623 DW=1.302302 F=947.8068 比较模型II,III,IV: III的x4的t都不显著,不是很好的模型。 IV虽然date,x4的t统计显著了很多,但使d3,d4的t统计不显著,所以模型IV不是很理想。 所以在多重共线性分析中应该选模型II。 因为D1的t检念不显著,去掉D1分析有: 输入命令ls y c date x5 d2 d3 d4 得方程V为: y=-131931.7 + 947.4899date + 123.5219X5 - 25759.27D2 -1906.967D3 + 8627.612D4 (-3.97) (6.20) (2.33) (-3.86) (-2.37) (2.65) R^2=0.996129 DW=1.252718 F=1338.020

评论