正文

[创亿无限]BAIDU一些分析2006-10-15 07:30:00

【评论】 【打印】 【字体: 】 本文链接:http://blog.pfan.cn/chuangyi/19328.html

分享到:

baidu的核心代码只有下面几行<html><head><title>百度——全球最大中文搜索引擎 </title></head><body><form name=f action=http://www.baidu.com/s><input type=text name=wd maxlength=100><input type=hidden name=cl value=3>  <input type=submit value=百度搜索><br><br></form></body></html> wd就是你要查询的关键词,cl是个隐藏的,由于是get方式发送表单,因此可以直接用构造好的url地址访问 要得到感兴趣的内容自然是用快照最准而定位快照连接的方法是这样首先在页面代码里搜索<table border="0" cellpadding="0" cellspacing="0">的位置L1然后以该位置为基础,搜索<a href="http://cache.baidu.com/得到最近的那个连接的位置L2再继续搜索"(双引号)的位置L3可以根据L2与L3取出关于本关键词的快照地址当然快照不是只有一个还可以继续按照这个步骤寻找利用这个可以做寻书的的php程序

阅读(3862) | 评论(1)


版权声明:编程爱好者网站为此博客服务提供商,如本文牵涉到版权问题,编程爱好者网站不承担相关责任,如有版权问题请直接与本文作者联系解决。谢谢!

评论

loading...
您需要登录后才能评论,请 登录 或者 注册