博客访问量计量经济分析 摘 要:运用计量经济学方法分析博客访问数.主要用多元线性回归,并对模型进行异方差,自相关,多重共线性检验,并对模型适当的修改.还有对数据引入虚拟变量. 关键词:线性回归,异方差,自相关,多重共线性,虚拟变量. 本文将运用计量经济分析方法来分析我自己博客点击量的影响因素.首先先考虑可能会影响的因素: 1.日期.这将会是影响访问量的因素.这就要求收集年,月,日的资料. 2.文章数.别人来你博客肯定是来看文章的,要不是干嘛来的? 3.评论数.个人觉的评论数很大程度和人气有关.当然现在很多人都是看文章不评论的~.(除我外,我最喜欢到处灌水了) 4.寒署假.鉴于我的博客是在"编程爱好者".而编程爱好者大多是学生.所以认为是否是寒署假可能会影响访问量.所以引入一虚拟变量. 5.2006.8.16后认识3个比较好的网友(baker,风飞,love-me).个人觉的在此前后的模型应该会受影响.所以引入一虚拟变量. 6.搜索网站的搜索,比如百度什么得可能隔一段什么会refresh一下连接。经过长期的观察得出,双休息日访问量和平时很大不同。在此引进是否食礼拜天得虚拟变量。 具体数据见:访问量数据.xls ――――收集数据人:elva6401 ――――last update in 2006-11-14 变量说明: y 访问总量 x1 年 x2 月 x3 日 x4 文章数 x5 评论数 Date 天数 D1 寒署假 D2 认识网友 D3 星期几 D4 双休日 原始数据可以查询:http://xiaonei.com/getuser.do?id=1375207691&t=5549853003 我博客地址:http://blog.programfan.com/blog.asp?blogid=1285 数据说明一:大部分数据是在整万旁边收集当然还是漏了几个数(十九万,二十三万,二十七万).至于后面10月分的数据是因为要写这篇文章所以特地每天收集. 数据说明二:天数是根据excel中的date计算出来,用来反映某天距离开博日的天数,具体公式是:date(x1,x2,x3)-date(2005,8,7).变量D1是一个虚拟变量,等于0表示放寒署假了,1当然表示正常上课.虚拟变量D2等于0表示未认识网友. 数据说明三:D3表示这天是星期几。使用excel中得weekday函数得到。D3=weekday(Date,1)。而D4为一个虚拟变量,星期六,星期天设为1,其他设为0。 本文对数据分析的工具为EView5和Excel.下面进行具体的分析: 首先输入命令ls y c date x4 x5 d1 d2 d3 d4 得方程I为: Y=-142177.9 + 797.0448date + 125.5901x4 + 123.5743x5 + 3224.223D1 (3.73) (2.02) (0.55) (2.01) (0.91) -28752.41D2 - 1692.685D3 +7860.762 (-3.55) (-1.86) (-2.11) R^2=0.996257 DW=1.43 F=912.6 R^2大于0.99,说明模拟优度很大。F统计量也是显著得。但其中x4,d1,d3的t统计量不显著。

评论