新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     >>计算机科学论坛<<     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> 搜索引擎, 信息分类与检索, 语义搜索, Lucene, Nutch, GRUB, Larbin, Weka
    [返回] 计算机科学论坛计算机技术与应用『 Web挖掘技术 』 → 热烈祝贺由Sohu副总裁王小川作序并鼎力推荐的《走进搜索引擎》正式出版发行,欢迎本书作者梁斌先生作客论坛,开辟答疑专贴! 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 225007 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: 热烈祝贺由Sohu副总裁王小川作序并鼎力推荐的《走进搜索引擎》正式出版发行,欢迎本书作者梁斌先生作客论坛,开辟答疑专贴! 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     liangbin 帅哥哟,离线,有人找我吗?
      
      
      等级:大二期末(数据结构考了98分!)
      文章:30
      积分:433
      门派:XML.ORG.CN
      注册:2007/10/22

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给liangbin发送一个短消息 把liangbin加入好友 查看liangbin的个人资料 搜索liangbin在『 Web挖掘技术 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看liangbin的博客31
    发贴心情 

    以下是引用qgs5665443在2007-12-4 12:38:00的发言:
    请问学习搜索引擎需要学什么样的先修课,如随机过程,
    数学需要达到什么样的程度才可以看懂你的书和李晓明老师的书,我看了一下李晓明老师的书,好象用了很多的数学知识

    如果你需要了解搜索引擎的原理不可避免需要一些数学知识,概率可能需要的多一些,另外本科的微积分等也有使用,都是基础,你说的随机过程在理解PageRank时需要一些,但是不是转研的很深,了解基本结论就可以了,就像工科数学大部分是公式,证明的东西并不多。

    李晓明老师的书很不错,可以仔细专研一下。

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/12/5 21:00:00
     
     wooq 帅哥哟,离线,有人找我吗?白羊座1986-4-11
      
      
      等级:大一(高数修炼中)
      文章:35
      积分:194
      门派:XML.ORG.CN
      注册:2007/12/9

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给wooq发送一个短消息 把wooq加入好友 查看wooq的个人资料 搜索wooq在『 Web挖掘技术 』 的所有贴子 点击这里发送电邮给wooq 引用回复这个贴子 回复这个贴子 查看wooq的博客32
    发贴心情 
    应该是本很不错的书

    ----------------------------------------------
    <b><a href="http://www.wangov.com/">网站建设</a></b>

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/12/16 1:58:00
     
     liny 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:0
      积分:55
      门派:XML.ORG.CN
      注册:2007/12/16

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给liny发送一个短消息 把liny加入好友 查看liny的个人资料 搜索liny在『 Web挖掘技术 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看liny的博客33
    发贴心情 
    书里介绍索引的内容有多少?深度怎么样?

    想问梁老师关于存储的看法即搜索引擎的存储系统将朝什么方向发展,将如何影响IR领域?

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/12/16 18:33:00
     
     fs_xxzx 帅哥哟,离线,有人找我吗?
      
      
      等级:大一(猛啃高等数学)
      文章:7
      积分:117
      门派:XML.ORG.CN
      注册:2007/12/3

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给fs_xxzx发送一个短消息 把fs_xxzx加入好友 查看fs_xxzx的个人资料 搜索fs_xxzx在『 Web挖掘技术 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看fs_xxzx的博客34
    发贴心情 
    本书对提高信息素养很有好处.
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/12/17 9:32:00
     
     liangbin 帅哥哟,离线,有人找我吗?
      
      
      等级:大二期末(数据结构考了98分!)
      文章:30
      积分:433
      门派:XML.ORG.CN
      注册:2007/10/22

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给liangbin发送一个短消息 把liangbin加入好友 查看liangbin的个人资料 搜索liangbin在『 Web挖掘技术 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看liangbin的博客35
    发贴心情 
    以下是引用liny在2007-12-16 18:33:00的发言:
    书里介绍索引的内容有多少?深度怎么样?


                         ~~~~~~~~~~~~~~这应该是一个比较主观的问题,建议你不妨去书店翻翻,实际地看一看。

    想问梁老师关于存储的看法即搜索引擎的存储系统将朝什么方向发展,将如何影响IR领域?                                                     
       
    ~~~~~~我想你可能是想了解索引系统,倒排表方面的信息。

    索引和查询系统是相互联系的,查询的需求驱动着索引的设计,而不是相反,从目前看倒排索引是大规模数据全文检索的最佳方式,另外还有一些其他方式,比如位图,署名文件等,(可以参见Managing gigabytes一书,此书国内96年引进过第一版,可以去学校图书馆借着看),书中详细比较了这些索引方式的优劣。

    IR从目前看来主要的困扰,或者说业界最需要解决的问题大致是这样几个方面
    (1)排序,如何更好的排序使得最能符合用户的查询企图(索引设计中也都考虑到了查询中排序的需要),关于排序,微软研究院也有很多不错的研究成果,可以参考。
    (2) 反垃圾,反作弊,这还是与排序有关,排序涉及了很多利益,因此大量的作弊导致搜索质量很低,搜索引擎需要大量的精力对付恶意SEO的一些做法。
    (3)专项搜索,目前可以看到很多这样的专项搜索,例如少儿搜索,图书搜索,论文搜索等,搜索引擎越来越开始照顾非主流的人群。专项搜索需要很多技术,例如分类,信息抽取,定向抓取等技术。

    [此贴子已经被DMman于2008-1-7 16:47:53编辑过]
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/12/20 15:12:00
     
     NeuFlyfox 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:4
      积分:66
      门派:XML.ORG.CN
      注册:2007/12/26

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给NeuFlyfox发送一个短消息 把NeuFlyfox加入好友 查看NeuFlyfox的个人资料 搜索NeuFlyfox在『 Web挖掘技术 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看NeuFlyfox的博客36
    发贴心情 
    这本书一上市,就在china-pub上买了这本书,我是网络方向的学生,对搜索还是很感兴趣的,觉得从这本书中收获不少,对于不是很熟悉搜索引擎的朋友来说,还是很值得一读的。
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/12/26 10:14:00
     
     liangbin 帅哥哟,离线,有人找我吗?
      
      
      等级:大二期末(数据结构考了98分!)
      文章:30
      积分:433
      门派:XML.ORG.CN
      注册:2007/10/22

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给liangbin发送一个短消息 把liangbin加入好友 查看liangbin的个人资料 搜索liangbin在『 Web挖掘技术 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看liangbin的博客37
    发贴心情 
    以下是引用NeuFlyfox在2007-12-26 10:14:00的发言:
    这本书一上市,就在china-pub上买了这本书,我是网络方向的学生,对搜索还是很感兴趣的,觉得从这本书中收获不少,对于不是很熟悉搜索引擎的朋友来说,还是很值得一读的。


    谢谢。

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/1/1 18:12:00
     
     changleqy 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:9
      积分:80
      门派:XML.ORG.CN
      注册:2008/1/2

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给changleqy发送一个短消息 把changleqy加入好友 查看changleqy的个人资料 搜索changleqy在『 Web挖掘技术 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看changleqy的博客38
    发贴心情 
    梁老师您好:订了一本书,明天就能到了,我想这应该是一本对我的学习很不错的书。
    我学的专业是管理工程(偏工),以前做过一段时间人机博奕,股票数据统计分析之类的研究工作,对WEB智能搜索也比较感兴趣。我想问一下,通过您所介绍的搜索技术,能不能和我以前所做的一些工作相结合,进行一些比较新的研究,(我的主要目的是想在着几年写几篇核心论文)谢谢!
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/1/2 19:59:00
     
     liangbin 帅哥哟,离线,有人找我吗?
      
      
      等级:大二期末(数据结构考了98分!)
      文章:30
      积分:433
      门派:XML.ORG.CN
      注册:2007/10/22

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给liangbin发送一个短消息 把liangbin加入好友 查看liangbin的个人资料 搜索liangbin在『 Web挖掘技术 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看liangbin的博客39
    发贴心情 
    以下是引用changleqy在2008-1-2 19:59:00的发言:
    梁老师您好:订了一本书,明天就能到了,我想这应该是一本对我的学习很不错的书。
                                                            ~~~~~~~~~~~~~~~~谢谢
          我学的专业是管理工程(偏工),以前做过一段时间人机博奕,股票数据统计分析之类的研究工作,对WEB智能搜索也比较感兴趣。我想问一下,通过您所介绍的搜索技术,能不能和我以前所做的一些工作相结合,进行一些比较新的研究,(我的主要目的是想在着几年写几篇核心论文)谢谢!
         ~~~~~~~~~~~~~~~~~~搜索引擎目前有很多数据挖掘的工作,大概我列一下,你可以参考
    (1)query suggestion
    (2)hint(相关搜索)
    (3)query correcting(纠错)
    (4)中文分词
    。。。
    应用还是很广泛的,我个人感觉股票统计工作和预测网页的排序可能有些方法上相通的关系,有个组在做User Rank类似的工作,通过用于的已有点击情况对未来的点击进行预测。
        
        

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/1/5 23:06:00
     
     changleqy 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:9
      积分:80
      门派:XML.ORG.CN
      注册:2008/1/2

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给changleqy发送一个短消息 把changleqy加入好友 查看changleqy的个人资料 搜索changleqy在『 Web挖掘技术 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看changleqy的博客40
    发贴心情 
    以下是引用liangbin在2008-1-5 23:06:00的发言:
    [quote]以下是引用changleqy在2008-1-2 19:59:00的发言:
    梁老师您好:订了一本书,明天就能到了,我想这应该是一本对我的学习很不错的书。
                                                             ~~~~~~~~~~~~~~~~谢谢
           我学的专业是管理工程(偏工),以前做过一段时间人机博奕,股票数据统计分析之类的研究工作,对WEB智能搜索也比较感兴趣。我想问一下,通过您所介绍的搜索技术,能不能和我以前所做的一些工作相结合,进行一些比较新的研究,(我的主要目的是想在着几年写几篇核心论文)谢谢!
          ~~~~~~~~~~~~~~~~~~搜索引擎目前有很多数据挖掘的工作,大概我列一下,你可以参考
    (1)query suggestion
    (2)hint(相关搜索)
    (3)query correcting(纠错)
    (4)中文分词
    。。。
    应用还是很广泛的,我个人感觉股票统计工作和预测网页的排序可能有些方法上相通的关系,有个组在做User Rank类似的工作,通过用于的已有点击情况对未来的点击进行预测。
         
         
    [/quote]


    非常感谢!
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/1/6 20:45:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 Web挖掘技术 』 的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/5/5 0:28:45

    本主题贴数78,分页: [1] [2] [3] [4] [5] [6] [7]... [8]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    109.009ms