本文对数据分析的工具为EView5和Excel.下面进行具体的分析: 首先输入命令 ls y c date x4 x5 d1 d2 得方程I为 y=-147038.1+1184.682date-92.50634x4+42.9646x5-683.6409d1 (-9.62) (9.41) (-1.33) (1.95) (-0.57) -8340.202d2 (3.03) R^2=0.999604 DW=0.820154 F=9096.01 模拟优度为0.999604,模拟的很好.F统计也大,F检验也是显著的.在看各变量的t统计量.其中x4,d1变量都不能通过t检验.而且x4系数为负和实际不符合.因为一般认为文章数越多访问量越高.看来x4可能不明显影响y. 在输入命令cor y date x4 x5 d1 d2有: Y DATE X4 X5 D1 D2 Y 1 0.99953 0.99481 0.99198 0.20257 0.91036 DATE 0.99953 1 0.99651 0.99277 0.20552 0.91772 X4 0.99481 0.99651 1 0.98631 0.16499 0.91838 X5 0.99198 0.99277 0.98631 1 0.28359 0.94557 D1 0.20257 0.20552 0.16499 0.28359 1 0.39887 D2 0.91036 0.91772 0.91838 0.94557 0.39887 1 由相关系数表可以看出d1与y的相关程度不大.而且d1不通过t检验.所以寒署假(d1)不是影响访问量的因素. 在输入命令 ls y c date x5 d2 得方程II: y=-144391.7 + 1035.567date + 55.07747x5 - 10496.53d2 (-12.09) (19.58) (3.09) (-4.82) R^2=0.999565 DW=0.808667 F=15325.16 模拟优度和F统计量都符合要求. 自相关检验: 在α=0.01,k=3,n=25查DW表有: dL=0.90,dU=1.41 因为方程II的DW=0.808667<dL=0.90所以模型存在一阶正自相关. Ρ=2-DW *0.5=0.595667 作一阶差分变换: Qy=y(t)-y(t-1) Qdate=date(t)-date(t-1) Qx5=x5(t)-x5(t-1) Qd2=d2(t)-d2(t-1) 在EView输入以下的命令: genr Qy=y-y(-1) genr Qdate=date-date(-1) genr Qx5=x5-x5(-1) genr Qd2=d2-d2(-1) 在输入命令ls Qy c Qdate Qx5 Qd2 得方程III为 Qy=412.6649 + 1055.066Qdate + 24.02877Qx5 (1.05) (19.63) (1.60) - 5156.232Qd2 (-2.49) R^2=0.971806 DW=2.303074 F=218.2981 此时α=0.01,k=3,n=24查DW表有: dL=0.88 dU=1.40 因为1.40=dU<DW=2.30<4-dU=2.6 所以消除了自相关性了.但却带来了一个新的问题.Qx5的t统计为1.60,比较小,要置信度大才能通过t检验.

评论