以文本方式查看主题

-  计算机科学论坛  (http://bbs.xml.org.cn/index.asp)
--  『 XML源码及示例(仅原创和转载) 』  (http://bbs.xml.org.cn/list.asp?boardid=32)
----  最近我研究 全文搜索引擎的心得(二)  (http://bbs.xml.org.cn/dispbbs.asp?boardid=32&rootid=&id=27974)


--  作者:erp2
--  发布时间:3/1/2006 4:14:00 PM

--  最近我研究 全文搜索引擎的心得(二)
最近我研究 全文搜索引擎的心得(二)

我最近在做搜索引擎最后的一个工序的两个程序(任务调度中心和任务执行)

我现在有 10太工作站,每台上面有 200万笔资料,电脑启动时就加载到内存中,由任务调度中心给他们分配工作任务,执行完毕后由任务中心将结果返回客户端 每个任务调度中心下面可以管理 254个工作站,每个工作站分配  200万笔数据信息,这样一来就可以满足更大数据量的处理了, 同时工作站的数据一开始就在内存中,所以处理起来速度会非常快,我想也许这是最好的方法了, baidu 或 google 也不可能有比这更好的办法了。(也许你会说这家伙太狂了),是的,确实有点。(在这些工作站里面会考虑专门给交费客户专用的工作站,专门用于新闻信息的工作站等划分)

希望对你有所帮助!
欢迎批评指正!
erp2@163.com
QQ: 99923309


--  作者:stupidren_ren
--  发布时间:3/8/2006 11:12:00 PM

--  
没有公司的强弱,只有技术你强弱,
佩服你楼主,向你学习
W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
35.156ms