正文

博客访问量计量经济分析(06-11-14)2006-11-14 20:21:00

【评论】 【打印】 【字体: 】 本文链接:http://blog.pfan.cn/elva6401/20328.html

分享到:

博客访问量计量经济分析

  要:运用计量经济学方法分析博客访问数.主要用多元线性回归,并对模型进行异方差,自相关,多重共线性检验,并对模型适当的修改.还有对数据引入虚拟变量.

关键词:线性回归,异方差,自相关,多重共线性,虚拟变量.

本文将运用计量经济分析方法来分析我自己博客点击量的影响因素.首先先考虑可能会影响的因素:

1.日期.这将会是影响访问量的因素.这就要求收集年,月,日的资料.

2.文章数.别人来你博客肯定是来看文章的,要不是干嘛来的?

3.评论数.个人觉的评论数很大程度和人气有关.当然现在很多人都是看文章不评论的~.(除我外,我最喜欢到处灌水了)

4.寒署假.鉴于我的博客是在"编程爱好者".而编程爱好者大多是学生.所以认为是否是寒署假可能会影响访问量.所以引入一虚拟变量.

5.2006.8.16后认识3个比较好的网友(baker,风飞,love-me).个人觉的在此前后的模型应该会受影响.所以引入一虚拟变量.

6.搜索网站的搜索,比如百度什么得可能隔一段什么会refresh一下连接。经过长期的观察得出,双休息日访问量和平时很大不同。在此引进是否食礼拜天得虚拟变量。

 

具体数据见:访问量数据.xls

――――收集数据人:elva6401 

――――last update in 2006-11-14

变量说明:

y

访问总量

x1

x2

x3

x4

文章数

x5

评论数

Date

天数

D1

寒署假

D2

认识网友

D3

星期几

D4

双休日

 

原始数据可以查询:http://xiaonei.com/getuser.do?id=1375207691&t=5549853003

我博客地址:http://blog.programfan.com/blog.asp?blogid=1285

 

数据说明一:大部分数据是在整万旁边收集当然还是漏了几个数(十九万,二十三万,二十七万).至于后面10月分的数据是因为要写这篇文章所以特地每天收集.

数据说明二:天数是根据excel中的date计算出来,用来反映某天距离开博日的天数,具体公式是:date(x1,x2,x3)-date(2005,8,7).变量D1是一个虚拟变量,等于0表示放寒署假了,1当然表示正常上课.虚拟变量D2等于0表示未认识网友.

数据说明三:D3表示这天是星期几。使用excel中得weekday函数得到。D3=weekday(Date,1)。而D4为一个虚拟变量,星期六,星期天设为1,其他设为0

 

本文对数据分析的工具为EView5Excel.下面进行具体的分析:

首先输入命令ls y c date x4 x5 d1 d2 d3 d4

得方程I:

Y=-142177.9 + 797.0448date + 125.5901x4 + 123.5743x5 + 3224.223D1

    (3.73)      (2.02)       (0.55)        (2.01)      (0.91)

-28752.41D2  - 1692.685D3 +7860.762

      (-3.55)           (-1.86)    (-2.11)

R^2=0.996257   DW=1.43   F=912.6

R^2大于0.99,说明模拟优度很大。F统计量也是显著得。但其中x4,d1,d3t统计量不显著。

阅读(3182) | 评论(0)


版权声明:编程爱好者网站为此博客服务提供商,如本文牵涉到版权问题,编程爱好者网站不承担相关责任,如有版权问题请直接与本文作者联系解决。谢谢!

评论

暂无评论
您需要登录后才能评论,请 登录 或者 注册