本文对数据分析的工具为EView5和Excel.下面进行具体的分析:
首先输入命令 ls y c date x4 x5 d1 d2
得方程I为
y=-147038.1+1184.682date-92.50634x4+42.9646x5-683.6409d1
(-9.62) (9.41) (-1.33) (1.95) (-0.57)
-8340.202d2
(3.03)
R^2=0.999604 DW=
模拟优度为0.999604,模拟的很好.F统计也大,F检验也是显著的.在看各变量的t统计量.其中x4,d1变量都不能通过t检验.而且x4系数为负和实际不符合.因为一般认为文章数越多访问量越高.看来x4可能不明显影响y.
在输入命令cor y date x4 x5 d1 d2有:
|
Y |
DATE |
X4 |
X5 |
D1 |
D2 |
Y |
1 |
0.99953 |
0.99481 |
0.99198 |
0.20257 |
0.91036 |
DATE |
0.99953 |
1 |
0.99651 |
0.99277 |
0.20552 |
0.91772 |
X4 |
0.99481 |
0.99651 |
1 |
0.98631 |
0.16499 |
0.91838 |
X5 |
0.99198 |
0.99277 |
0.98631 |
1 |
0.28359 |
0.94557 |
D1 |
0.20257 |
0.20552 |
0.16499 |
0.28359 |
1 |
0.39887 |
D2 |
0.91036 |
0.91772 |
0.91838 |
0.94557 |
0.39887 |
1 |
由相关系数表可以看出d1与y的相关程度不大.而且d1不通过t检验.所以寒署假(d1)不是影响访问量的因素.
在输入命令 ls y c date x5 d2
得方程II:
y=-144391.7 + 1035.567date + 55.07747x5 - 10496.53d2
(-12.09) (19.58) (3.09) (-4.82)
R^2=0.999565 DW=
模拟优度和F统计量都符合要求.
自相关检验:
在α=0.01,k=3,n=25查DW表有:
dL=0.90,dU=1.41
因为方程II的DW=0.808667<dL=0.90所以模型存在一阶正自相关.
Ρ=2-DW *0.5=0.595667
作一阶差分变换:
Qy=y(t)-y(t-1) Qdate=date(t)-date(t-1)
Qx5=x5(t)-x5(t-1) Qd2=d2(t)-d2(t-1)
在EView输入以下的命令:
genr Qy=y-y(-1)
genr Qdate=date-date(-1)
genr Qx5=x5-x5(-1)
genr Qd2=d2-d2(-1)
在输入命令ls Qy c Qdate Qx5 Qd2
得方程III为
Qy=412.6649 + 1055.066Qdate + 24.02877Qx5
(1.05) (19.63) (1.60)
- 5156.232Qd2
(-2.49)
R^2=0.971806 DW=
此时α=0.01,k=3,n=24查DW表有:
dL=0.88 dU=1.40
因为1.40=dU<DW=2.30<4-dU=2.6
所以消除了自相关性了.但却带来了一个新的问题.Qx5的t统计为1.60,比较小,要置信度大才能通过t检验.
评论