用white检验来检验异方差:
首先新建一个excel(while check.xls)文件。在这个表格中计算出
x5*x5 x5*date…两两乘积。
再用E-Views打开while check.xls。
输入命令Ls e c x5 date d2 d3 d4 x5_x5 x5_date x5_d2 x5_d3 x5_d4 date_date date_d2 date_d3 date_d4 d2_d2 d2_d3 d2_d4 d3_d3 d3_d4 d4_d4
得结果为:
Error Message:Near singular matrix.
原因是这里面很多变量线形相关。
X5_d2 date_d2 d2_d2 d2_d3 d2_d4 和 d2线形相关只保留一个d2可以
X5_d4 date_d4 d3_d4 d4_d4和d4线形相关只保留一个d4可以
在输入命令ls e c x5 date d2 d3 d4 x5_x5 x5_date x5_d3 x5_d4 date_date date_d3 date_d4 d3_d3
得结果:
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
|
|
|
|
|
|
|
|
|
|
C |
-1836978. |
611399.5 |
-3.004545 |
0.0076 |
X5 |
-4549.198 |
1486.110 |
-3.061145 |
0.0067 |
DATE |
15173.63 |
5246.480 |
2.892154 |
0.0097 |
D2 |
6906.093 |
4593.192 |
1.503550 |
0.1500 |
D3 |
53060.18 |
22554.40 |
2.352542 |
0.0302 |
D4 |
-238998.5 |
80093.47 |
-2.983995 |
0.0080 |
X5_X5 |
-2.743495 |
0.945331 |
-2.902153 |
0.0095 |
X5_DATE |
18.66262 |
6.482610 |
2.878874 |
0.0100 |
X5_D3 |
48.93144 |
26.20108 |
1.867535 |
0.0782 |
X5_D4 |
-216.9174 |
81.26217 |
-2.669353 |
0.0156 |
DATE_DATE |
-31.28757 |
11.33508 |
-2.760242 |
0.0129 |
DATE_D3 |
-201.7870 |
94.92663 |
-2.125716 |
0.0476 |
DATE_D4 |
900.2335 |
311.1300 |
2.893432 |
0.0097 |
D3_D3 |
16.51403 |
247.5906 |
0.066699 |
0.9476 |
|
|
|
|
|
|
|
|
|
|
R-squared |
0.736841 |
Mean dependent var |
-7.32E-11 | |
Adjusted R-squared |
0.546782 |
S.D. dependent var |
4336.745 | |
S.E. of regression |
2919.561 |
Akaike info criterion |
19.09589 | |
Sum squared resid |
1.53E+08 |
Schwarz criterion |
19.73715 | |
Log likelihood |
-291.5342 |
F-statistic |
3.876902 | |
Durbin-Watson stat |
1.474553 |
Prob(F-statistic) |
0.004443 |
R^2=0.736841 DW=
上面的回归方程有13个变量,所以n=13.nR^2=13*0.736841=9.57893
α=0.01,n-k-1=31-13-1=17查卡方分布表有:
Xα(17)=6.408<9.57893=nR^2
所以模型的white检验存在异方差.
用图示法分析:
ls y c date x5 d2 d3 d4
genr e=resid
scat y e^2
得图形:
也可以看出存在异方差。
修正:
对y,date,x5分别取对数再回归可能可以消除异方差。
输入命令ls log(y) c log(date) log(x5) d2 d3 d4
得方程VI为:
Log(y)=2.539339 + 1.587883log(date) + 0.094314log(x5) - 0.062049D2
(6.62) (15.96) (2.56) (-5.14)
-0.006046D3 + 0.025020D4
(-3.06) (-3.07)
R^2=0.998302 DW=
比较模型V和模型VI:
VI的R^2=0.998比V的R^2=737显著提高了。
在α=0.01,k=5,n=31查DW表有:
dL=0.90,dU=1.60
模型VI的DW落再dU到4-dU的区间,明显不存在自相关性。而V的DW落在无法判断的区域。
所以模型VI比模型V好。
用图示法Check 异方差:
ls log(y) c log(date) log(x5) d2 d3 d4
genr lne=resid
scat y lne^2
基本上可以用一水平直线模拟这些点。所以异方差也很好的被消除了。
所以模型VI的异方差,自相关,多重共线都很好被消除,可以用它来预测。
所以确定最后的模型为:
Log(y)=2.539339 + 1.587883log(date) + 0.094314log(x5) - 0.062049D2
(6.62) (15.96) (2.56) (-5.14)
-0.006046D3 + 0.025020D4
(-3.06) (-3.07)
R^2=0.998302 DW=
评论