博客访问量计量经济分析
摘 要:运用计量经济学方法分析博客访问数.主要用多元线性回归,并对模型进行异方差,自相关,多重共线性检验,并对模型适当的修改.还有对数据引入虚拟变量.
关键词:线性回归,异方差,自相关,多重共线性,虚拟变量.
本文将运用计量经济分析方法来分析我自己博客点击量的影响因素.首先先考虑可能会影响的因素:
1.日期.这将会是影响访问量的因素.这就要求收集年,月,日的资料.
2.文章数.别人来你博客肯定是来看文章的,要不是干嘛来的?
3.评论数.个人觉的评论数很大程度和人气有关.当然现在很多人都是看文章不评论的~.(除我外,我最喜欢到处灌水了)
4.寒署假.鉴于我的博客是在"编程爱好者".而编程爱好者大多是学生.所以认为是否是寒署假可能会影响访问量.所以引入一虚拟变量.
5.2006.8.16后认识3个比较好的网友(baker,风飞,love-me).个人觉的在此前后的模型应该会受影响.所以引入一虚拟变量.
6.搜索网站的搜索,比如百度什么得可能隔一段什么会refresh一下连接。经过长期的观察得出,双休息日访问量和平时很大不同。在此引进是否食礼拜天得虚拟变量。
具体数据见:访问量数据.xls
――――收集数据人:elva6401
――――last update in
变量说明:
y |
访问总量 |
x1 |
年 |
x2 |
月 |
x3 |
日 |
x4 |
文章数 |
x5 |
评论数 |
Date |
天数 |
D1 |
寒署假 |
D2 |
认识网友 |
D3 |
星期几 |
D4 |
双休日 |
原始数据可以查询:http://xiaonei.com/getuser.do?id=1375207691&t=5549853003
我博客地址:http://blog.programfan.com/blog.asp?blogid=1285
数据说明一:大部分数据是在整万旁边收集当然还是漏了几个数(十九万,二十三万,二十七万).至于后面10月分的数据是因为要写这篇文章所以特地每天收集.
数据说明二:天数是根据excel中的date计算出来,用来反映某天距离开博日的天数,具体公式是:date(x1,x2,x3)-date(2005,8,7).变量D1是一个虚拟变量,等于0表示放寒署假了,1当然表示正常上课.虚拟变量D2等于0表示未认识网友.
数据说明三:D3表示这天是星期几。使用excel中得weekday函数得到。D3=weekday(Date,1)。而D4为一个虚拟变量,星期六,星期天设为1,其他设为0。
本文对数据分析的工具为EView5和Excel.下面进行具体的分析:
首先输入命令ls y c date x4 x5 d1 d2 d3 d4
得方程I为:
Y=-142177.9 + 797.0448date + 125.5901x4 + 123.5743x5 + 3224.223D1
(3.73) (2.02) (0.55) (2.01) (0.91)
-28752.41D2 - 1692.685D3 +7860.762
(-3.55) (-1.86) (-2.11)
R^2=0.996257 DW=
R^2大于0.99,说明模拟优度很大。F统计量也是显著得。但其中x4,d1,d3的t统计量不显著。
评论