博文
预测(2006-11-14 20:27:00)
摘要:预测:
在预测前首先存在一个问题就是在预测点的x5(评论数)是未知量。
但cov(date,x5)=0.9928
所以可以用date模拟预测出x5在预测整个模型的结果。
ls x5 c date x5=-813.6367+3.491237date
现在来预测本月里的访问量
2006-11-30
不用模型可以先预测下访问量。
11月1号的y= 360182
11月14号的y= 384771
11月份平均访问量为=(384771-360182)/13=1891.461538
现在到月底大概还有30-14=16天
1891.461538*16=30263.38462
预测的y值为:360182+30263=390445
date=480 计算x5=862 d3=4 所以d4=0 d2=1
log(y)= 2.539339 + 1.587883*log(480) + 0.094314log(862) - 0.062049*1
-0.006046*4 + 0.025020*0
=12.8938484
所以y=exp(12.8938484)= 397857.1903
这个y和没用模型预测的y相差不是很大
预测效果不错~
模型最后分析到此。(2006-11-14 14:00于祥哥电脑)......
用white检验来检验异方差(2006-11-14 20:26:00)
摘要:
用white检验来检验异方差:
首先新建一个excel(while check.xls)文件。在这个表格中计算出
x5*x5 x5*date…两两乘积。
再用E-Views打开while check.xls。
输入命令Ls e c x5 date d2 d3 d4 x5_x5 x5_date x5_d2 x5_d3 x5_d4 date_date date_d2 date_d3 date_d4 d2_d2 d2_d3 d2_d4 d3_d3 d3_d4 d4_d4
得结果为:
Error Message:Near singular matrix.
原因是这里面很多变量线形相关。
X5_d2 date_d2 d2_d2 d2_d3 d2_d4 和 d2线形相关只保留一个d2可以
X5_d4 date_d4 d3_d4 d4_d4和d4线形相关只保留一个d4可以
在输入命令ls e c x5 date d2 d3 d4 x5_x5 x5_date x5_d3 x5_d4 date_date date_d3 date_d4 d3_d3
得结果:
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-1836978.
611399.5
-3.004545
0.0076
X5
-4549.198
1486.110
-3.061145
0.0067
DATE
15173.63
5246.480
2.892154
0.0097
D2
6906.093
4593.192
1.503550
0.1500
D3
53060.18
22554.40
2.352542
0.0302
D4
-238998.5
80093.47
-2.9......
自相关检验(2006-11-14 20:25:00)
摘要:
自相关检验:
对于模型V:
在α=0.01,k=5,n=31查DW表有:
dL=0.90,dU=1.60
DW=1.252718 dL<DW<dU 无法判断的区域~
用图示分析:
ls y c date x5 d2 d3 d4
genr e=resid
scat e(-1) e
从图中可以看除,残差分布比较凌乱。估计不存在自相关。......
多重共线性分析(2006-11-14 20:22:00)
摘要:
多重共线性分析:
输入命令cor y date x4 x5 d1 d2 d3 d4
Y
DATE
X4
X5
D1
D2
D3
D4
Y
1.0000
0.9963
0.9934
0.9892
0.3040
0.8998
-0.1518
-0.1552
DATE
0.9963
1.0000
0.9975
0.9928
0.3034
0.9165
-0.1393
-0.1614
X4
0.9934
0.9975
1.0000
0.9886
0.2713
0.9174
-0.1320
-0.1427
X5
0.9892
0.9928
0.9886
1.0000
0.3631
0.9445
-0.1668
-0.1727
D1
0.3040
0.3034
0.2713
0.3631
1.0000
0.4526
-0.2160
-0.1698
D2
0.8998
0.9165
0.9174
0.9445
0.4526
1.0000
-0.1403
-0.1287
D3
-0.1518
-0.1393
-0.1320
-0.1668
-0.2160
-0.1403
1.0000
0.8450
D4
-0.1552
-0.1614
-0.1427
-0.1727
-0.1698
-0.1287
0.8450
1.0000
其中cov(date,x4)=0.9975,cov(date,x5)=0.9928 ,cov(x4,x5)=0.9886
说明date,x4,x5存在严重的多重共线性。
修......
博客访问量计量经济分析(06-11-14)(2006-11-14 20:21:00)
摘要:
博客访问量计量经济分析
摘 要:运用计量经济学方法分析博客访问数.主要用多元线性回归,并对模型进行异方差,自相关,多重共线性检验,并对模型适当的修改.还有对数据引入虚拟变量.
关键词:线性回归,异方差,自相关,多重共线性,虚拟变量.
本文将运用计量经济分析方法来分析我自己博客点击量的影响因素.首先先考虑可能会影响的因素:
1.日期.这将会是影响访问量的因素.这就要求收集年,月,日的资料.
2.文章数.别人来你博客肯定是来看文章的,要不是干嘛来的?
3.评论数.个人觉的评论数很大程度和人气有关.当然现在很多人都是看文章不评论的~.(除我外,我最喜欢到处灌水了)
4.寒署假.鉴于我的博客是在"编程爱好者".而编程爱好者大多是学生.所以认为是否是寒署假可能会影响访问量.所以引入一虚拟变量.
5.2006.8.16后认识3个比较好的网友(baker,风飞,love-me).个人觉的在此前后的模型应该会受影响.所以引入一虚拟变量.
6.搜索网站的搜索,比如百度什么得可能隔一段什么会refresh一下连接。经过长期的观察得出,双休息日访问量和平时很大不同。在此引进是否食礼拜天得虚拟变量。
具体数据见:访问量数据.xls
――――收集数据人:elva6401
――――last update in 2006-11-14
变量说明:
y
访问总量
x1
年
x2
月
x3
日
x4
文章数
x5
评论数
Date
天数
D1
寒署假
D2
认识网友
D3
星期几
D4
双休日
原始数据可以查询:http://xiaonei.com/getuser.do?id=1375207691&t=5549853003
我博客地址:http://blog.programfan.com/blog.asp?blogid=1285
数据说明一:大部分数据是在整万旁边收集当然还是漏了几个数(十九万,二十三万,二十七万).至于后面10月分的数据是因为要写这篇文章所以特地每天收集.
数据说明二:天数是根据exc......
杂谈(06-10-15)(2006-10-15 20:49:00)
摘要: 因为马哲挂了,心情总是不太好.今天做了一套数学模拟题,后来对了下答案只有83(总分150),很多题目不是不会做,而是经常看错题,状态真是不佳.用在复习数学的时间最久了,差不多3个月了,结果还是这样失望~~又是一个不及格.现在听到不及格心理就超不舒服.查到成绩的那天心情只能用能用"郁闷"2个字来形容的.本来马哲考完了自己感觉还好,那时感觉应该会及格.考完那天马哲老师也说了"这次你们都答的比较好",但结果真失望.既然都答的还可以为什么只有一个人及格?有时候TMD人真是当面说一套后面做一套.不及格就算了,还要比上次底.TMD信心都快被他打击光了.41分现在真是担心明年能不能毕业?就因为TMD一个学了什么用都没有的马哲而毕不了业,真TMD死也不瞑目.如果考研考上了,因为马哲挂了而毕不了业进而读不了研.什么滋味?昨天到我学校的论坛发一个标题为:"[求助]没拿到本科毕业证,可以读研吗?"的帖子,当我发这贴的时候有没有人能体会到我的心情:两个字形容:"绝望".但回复的结果很令人失望.一ID为:"gatesnow"回答到:"
不行的,2006级硕士研究生入学报到须知(内 招 生)中有这么一条:
2、应届本科毕业生须凭本人的本科毕业证书原件和复印件办理报到和注册手续,未获得本科毕业证书者,取消入学资格
假如行的话我就TMD不拿本科毕业证,直接读研去.看TMD还用什么来刁难我.用两个词组形容我的马哲老师:"变态","更年期".因为他我鄙视所有从北大出来的人,北大就TMD只能培养出这样的了垃圾.在一次BS~~
假如不辛真是被说中了,因为马哲而毕不了业.我怎么办呢?
可能就老老实实读大五.
也可能一刀把TMD马哲老师干掉
然后自己也就over了~~
或者.....
可能想法有点极端,但TMD做人整天憋着口气真TMD窝囊.其实人不是像他那样做的~~
PS:今天终于把这段话说出来了,整天憋在肚子真难受.以前怕有人看到了打小报告什么的.毕竟我在班上人缘不是很好,班上还是有人知道我博客的.现在豁出去了.
还是好好复习,不要在想什么马哲了.相信一句话:"船到桥头自然直".
......
备份(2006-10-03 15:17:00)
摘要:我不是学编程的,现在已经很久没有编程了.
要考研了,有兴趣的人可以联系我的QQ.
偶的QQ是:649254133(原来的QQ中病毒了),不在的时候也可以给我发邮件.
elva6401@163.com
mm模板蛮好看的,暂时用它拉。呵呵 :)-
以下是我的签名:
晚上好好睡觉,白天努力学习。
补充一点:我不是2只鱼(经常受到一些鱼粉骚乱...)
暨大研招办
http://yz.jnu.edu.cn
删除
考研论坛
http://bbs.kaoyan.com
删除
班级录
http://sunwei0111.alumni.chinaren.com
删除
baker的blog
http://blog.programfan.com/blog.asp?blogid=2210
删除
彬彬有理的blog
http://blog.sina.com.cn/u/1463886245
删除
文青博客(推荐)
http://www.blogcn.com/user87/caiiaoli/index.html
删除
2只鱼BLOG
http://blog.sina.com.cn/m/twofish
删除
管理员的blog
http://blog.programfan.com/blog.asp?blogid=1
删除
老收藏夹I
http://blog.programfan.com/article.asp?id=10533
删除
老收藏夹II
http://blog.programfan.com/article.asp?id=17477
删除
C语言吧灌水贴
http://post.baidu.com/f?kz=6459971
删除
lancytt的blog
http://lancyttt.blog.sohu.com/
删除
风飞的blog
http://blog.programfan.com/blog.asp?blogid=1772
......
朱茵档案(2006-09-20 20:44:00)
摘要:英文名:Athena Chu
籍 贯:广东顺德
出生地点:香港
出生日期:1971年10月25日
星 座:天蝎座
身 高:160cm
体 重:44kg
血 型:AB
家庭状况:父母及一姊
兴 趣:演戏唱歌看书
最喜爱的亲人:母亲
最向往的国家:希腊
最喜欢的颜色:漆黑一片,因为可以胡思乱想
最喜欢的季节:春夏秋冬
最爱穿的衣服:轻而便
最想做的事:令家人开心
最讨厌的事:没有
最大的希望:可为世界和平尽一点力
最失望的事:当甚麽都消失的时候
最喜欢的动物:猴子小龟小狗
最讨厌的动物:小蚊子
最爱吃的食物:母亲做的小菜
最讨厌的食物:不好吃的东西
最喜欢的运动:游泳
最喜欢的音乐:带有西班牙味道的音乐
最喜爱的歌星:MariahCarey,WhitneyHouston
最欣赏的影星:辛康纳利(老年)
最害怕的事:肚子饿
最得意的事:被人欣赏的时候
......