FROM:http://www.wespoke.com百度硬盘搜索将于下周一推出颇受注目的[百度硬盘搜索],说瞩目,原因是在搜索引擎大比拼的时代,能否吸引用户,吸引了用户后能否守住用户,现在似乎大家的共识是在桌面上了。而这一款硬盘搜索也将逼迫同行业的中文搜索引擎们要考虑如何巩固市场的问题了。百度硬盘搜索下载 http://disk.baidu.com/在使用了几天的百度硬盘搜索引擎概括的看起来有如下的特征:1] Google Like就是从设计风格上和理念上都沿袭了google 的硬盘搜索产品,趋同设计或者copy strategy是现在一个减少开发成本减少创新成本的绝招,这点上百度做的非常到位。2] Baidu Style当然,是中文产品,就有中文产品的特征。突出的特征有两个:1.中文分词--这个简直是废话!不能分词不就是google 硬盘搜索了么?2.加密码功能。这个功能很体贴,因为加了密码就在一定程度上保护了个人隐私,对于中国现在还不能人手一台电脑的国情考虑的比较周到。3] Something whoops.1. 图片搜索没有能给出缩略图,这样的话这个功能显然就型同虚设了。而且最重要的是,因为图片搜索在网页上的算法跟本地的文件系统的算法的差异很大,因此这个功能应该说开发的不算好。2. 长结构的语句搜索,硬盘搜索的分词系统不如百度网站本身的好。这点上等下我有两张图可以做对比。我想百度的硬盘搜索并没有完全采用百度网页的分词算法,因此可以从长句子的查询中得到结果,本地的硬盘搜索是先对长语句进行分词后进行“and”的查询结构,查询后没有进行进一步的“=”的验证。4] Something cool.1.索引的快速。我0.8G的笔记本平时运行个PPT都只喘气,20分钟内百度硬盘搜索索引了6000多个文档。搜索起来也非常的快。2.能够方便的索引中文word/ppt/pdf/xml/..... 并能够清晰的区分的方式显示搜索结果和数目。百度硬盘搜索能够占领多大的市场?这点上我没有概念,在百度硬盘搜索之前,我曾经使用过几个硬盘搜索工具,中文的硬盘搜索例如 88data.com ,就做的相当不错。不过市场还没有做起来,因此88data到现在的搜索量看起来还是一个可怜的数字。百度的客户端一直做的不错,以前的百度下吧我曾经用来下过一阵子电影,不过后来没有了Windows Desktop就算了。百度下吧显然没有百度硬盘搜索要容易推广,一来下吧有竞争对手无数,二来总有侵犯版权的嫌疑。而这个硬盘搜索则是毫无后顾之忧,而且能够固化用户的忠诚度,估计会大力推广。百度硬盘搜索能有其它玩法么?当然了,这里我就说说一个利用百度硬盘搜索制作个人搜索引擎的方法,如果你有两台空闲的计算机并且在同一个局域网内的话:1] 请你准备一台Linux 计算机,这台是做爬虫用的和搜索引擎的前端。2] 请你格式掉另外一台计算机,从新安装全新的windows系统,安装上百度硬盘搜索。下面配置Linux 服务器3] Linux 上建立一个目录专门用来存放抓到的网页,并启动爬虫程序4] Linux 上将这个目录采用 samb 的方式输出5] Linux 配置Apache 的前端,作为搜索引擎的入口6] Apache 采用Url rewrite到 Windows 计算机的7887端口进行真正的请求下面配置Windows服务器7] 在windows上联结 Linux 上的Samb 的输出,挂上这个Linux 的输出目录,映射到本地8] 下载安装百度硬盘搜索,并运行索引返回到Linux 服务器好了,这台Linux 服务器就可以进行搜索引擎服务了,改变你自己的 pagestyle就可以做成自己的搜索引擎了。

评论