以文本方式查看主题

-  计算机科学论坛  (http://bbs.xml.org.cn/index.asp)
--  『 最新动态 & 业界新闻 』  (http://bbs.xml.org.cn/list.asp?boardid=35)
----  Looksmart公司的grub搜索引擎: 一个基于分布式计算技术的搜索引擎[原创]  (http://bbs.xml.org.cn/dispbbs.asp?boardid=35&rootid=&id=29249)


--  作者:zhaoke
--  发布时间:3/25/2006 7:12:00 AM

--  Looksmart公司的grub搜索引擎: 一个基于分布式计算技术的搜索引擎[原创]
Looksmart公司的grub搜索引擎: 一个基于分布式计算技术的搜索引擎

发表者: 赵珂 2006年03月25日 #110

http://blog.joylinux.org/zhaoke/cn/110.html

Looksmart公司的grub是一个基于分布式计算技术的搜索引擎, 用户可以下载grubclient客户端软件, 然后在计算机有空闲的时候运行它. 计算机(客户端)索引网址信息, 然后把压缩的索引信息传输到grub服务器. 接着grub服务器通过分析所有的索引信息生成一个大的缓存库, 从而用户可以使用Grub网站对缓存库进行搜索.

发展历史:
2000年6月 Igor Stojanovski, Kord Campbell和Ledio Ago创建Grub开源项目
2003年1月23日 Looksmart公司于全盘收购Grub的所有资产

优点:
可利用Grubclient客户端收集的索引信息快速够建一个大的缓存库. Grub的索引速度比Google要快.

缺点:
1. 不能向Google那样提供更准确的结果给用户.
2. 不受网站robots.txt文件的限制.
3. 不能很好处理大量的TCP链接, 容易超载而拒绝服务.

更多:
1. LOOKSMART LTD (Form 10-K, Received 03-14-2003 165920)
2. SourceForge.net grub.org - Distributed Internet Crawler
3. Koders - Grub Source Code


W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
3,703.125ms