新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     >>计算机科学论坛<<     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> 搜索引擎, 信息分类与检索, 语义搜索, Lucene, Nutch, GRUB, Larbin, Weka
    [返回] 计算机科学论坛计算机技术与应用『 Web挖掘技术 』 → 热烈祝贺由Sohu副总裁王小川作序并鼎力推荐的《走进搜索引擎》正式出版发行,欢迎本书作者梁斌先生作客论坛,开辟答疑专贴! 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 224771 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: 热烈祝贺由Sohu副总裁王小川作序并鼎力推荐的《走进搜索引擎》正式出版发行,欢迎本书作者梁斌先生作客论坛,开辟答疑专贴! 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     zeng16107 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:2
      积分:66
      门派:XML.ORG.CN
      注册:2007/11/12

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给zeng16107发送一个短消息 把zeng16107加入好友 查看zeng16107的个人资料 搜索zeng16107在『 Web挖掘技术 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看zeng16107的博客61
    发贴心情 

    very good!
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/5/15 20:22:00
     
     wulin5050 帅哥哟,离线,有人找我吗?
      
      
      等级:大一(高数修炼中)
      文章:11
      积分:122
      门派:XML.ORG.CN
      注册:2008/2/29

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给wulin5050发送一个短消息 把wulin5050加入好友 查看wulin5050的个人资料 搜索wulin5050在『 Web挖掘技术 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看wulin5050的博客62
    发贴心情 正在学这个
    我也正在学这个!大家交流
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/5/18 0:48:00
     
     vanway 帅哥哟,离线,有人找我吗?处女座1981-8-28
      
      
      等级:大一新生
      文章:4
      积分:68
      门派:XML.ORG.CN
      注册:2008/5/19

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给vanway发送一个短消息 把vanway加入好友 查看vanway的个人资料 搜索vanway在『 Web挖掘技术 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看vanway的博客63
    发贴心情 
    看到本文才注册了这个帐号
    国内讲搜索引擎方面的书还不多,感谢梁先生为搜索引擎技术的普及和发展所作的工作
    在这里,想请问梁先生三个问题:
    1、据我所知,搜索引擎一个很重要的方面就是其效率,google的page rank算法,作为一个巨大矩阵的运算要实现,也是由于其非常好的算法实现。梁先生能指导一下相关方面的研究资料吗?
    2、同样,数据挖掘之与搜索引擎结合,也同样存在着算法效率的问题。或采用相对简单的数据挖掘算法,或设计结合的模式,或优化数据挖掘的实现。此方面相关知识,能否请梁先生不吝赐教
    3、也是我在工作中一直遇到的问题,就是人们“关心”的概念,当我们在做聚类和分类的时候,我们可以用xxx算法,得到yy%的结果。可是我们得到的结果是否是人们感兴趣,甚至人和人感兴趣的层次和角度也不同,或者说,需要根据相同问题的不同层次或角度来解决问题。请问,您的工作中遇到相关问题,一般会采用什么样的策略。

    感谢梁先生百忙之中的赐教

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/5/19 13:17:00
     
     liangbin 帅哥哟,离线,有人找我吗?
      
      
      等级:大二期末(数据结构考了98分!)
      文章:30
      积分:433
      门派:XML.ORG.CN
      注册:2007/10/22

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给liangbin发送一个短消息 把liangbin加入好友 查看liangbin的个人资料 搜索liangbin在『 Web挖掘技术 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看liangbin的博客64
    发贴心情 
    (1)
    PageRank是典型的稀疏阵的计算,其实有很多简化的方法,即如计算siterank,将page级的计算转化到site级的计算。
    (2)
    搜索引擎就可以看作是一个数据挖掘系统,当然实际的方法和传统数据挖掘有很大区别。
    这个问题比较大,一般来说搜索结果分为这样几个部分
       1)parse   网页的解析  
       2)analysis  网页的数据结构化,分析等
                antispame
                web quality
                        page rank
                        other ranks
                ...

       3)index
              distributed index
       4)query
              match rank
              other rank
              summay
           这个问题比较大,几乎搜索的方方面面都在为最后的效果发挥巨大的作用。

    第三个问题,搜索引擎目前主要覆盖的是大众的兴趣,就像做一个春节晚会,各种资源都具备了,就是不能让全国人民满意,我想我们任何人去办这台晚会都不能做到让任何人都满意。当然努力的目标是让更多的人满意,个性化的搜索,新闻推送目前都在研究和尝试,最终做到让尽可能多的人满意,照顾尽可能多的人的多方面需求。    


    以下是引用vanway在2008-5-19 13:17:00的发言:
    看到本文才注册了这个帐号
    国内讲搜索引擎方面的书还不多,感谢梁先生为搜索引擎技术的普及和发展所作的工作
    在这里,想请问梁先生三个问题:
    1、据我所知,搜索引擎一个很重要的方面就是其效率,google的page rank算法,作为一个巨大矩阵的运算要实现,也是由于其非常好的算法实现。梁先生能指导一下相关方面的研究资料吗?
    2、同样,数据挖掘之与搜索引擎结合,也同样存在着算法效率的问题。或采用相对简单的数据挖掘算法,或设计结合的模式,或优化数据挖掘的实现。此方面相关知识,能否请梁先生不吝赐教
    3、也是我在工作中一直遇到的问题,就是人们“关心”的概念,当我们在做聚类和分类的时候,我们可以用xxx算法,得到yy%的结果。可是我们得到的结果是否是人们感兴趣,甚至人和人感兴趣的层次和角度也不同,或者说,需要根据相同问题的不同层次或角度来解决问题。请问,您的工作中遇到相关问题,一般会采用什么样的策略。

    感谢梁先生百忙之中的赐教


    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/5/19 21:24:00
     
     amoysem 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:4
      积分:70
      门派:XML.ORG.CN
      注册:2008/10/21

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给amoysem发送一个短消息 把amoysem加入好友 查看amoysem的个人资料 搜索amoysem在『 Web挖掘技术 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看amoysem的博客65
    发贴心情 
    梁老师有没有个人BLOG类的呢?
    很想关注下,你对搜索引擎的相关看法!

    你的《走进搜索引擎》上周刚买!

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/10/21 7:26:00
     
     天涯咫尺之遥 美女呀,离线,快来找我吧!
      
      
      等级:大一新生
      文章:8
      积分:98
      门派:XML.ORG.CN
      注册:2007/11/17

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给天涯咫尺之遥发送一个短消息 把天涯咫尺之遥加入好友 查看天涯咫尺之遥的个人资料 搜索天涯咫尺之遥在『 Web挖掘技术 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看天涯咫尺之遥的博客66
    发贴心情 谢谢梁老师
    现在我才确定自己的方向
    我导师是做数据库的,所以我现在选择了存储的方向,但我对无线通信这个方向也特别有兴趣,所以想以后能做无线通信方面的数据库,梁老师,感觉这个方向怎样呢?
    以前总觉得女孩子不适合搞计算机,突然发现了自己的优势,我英语还不错,比较善于跟同学沟通,还有就是我得逻辑思维能力还是可以的,性别的劣势反而能成为我的优势,这是我的想法。
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/10/21 9:09:00
     
     liangbin 帅哥哟,离线,有人找我吗?
      
      
      等级:大二期末(数据结构考了98分!)
      文章:30
      积分:433
      门派:XML.ORG.CN
      注册:2007/10/22

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给liangbin发送一个短消息 把liangbin加入好友 查看liangbin的个人资料 搜索liangbin在『 Web挖掘技术 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看liangbin的博客67
    发贴心情 
    我目前没有blog,我经常活跃在水木清华BBS的搜索引擎版,大家可以去哪里找到我发的一些文章。
    http://www.newsmth.net/bbsdoc.php?board=SearchEngineTech

    以下是引用amoysem在2008-10-21 7:26:00的发言:
    梁老师有没有个人BLOG类的呢?
    很想关注下,你对搜索引擎的相关看法!

    你的《走进搜索引擎》上周刚买!


    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/10/21 12:45:00
     
     liangbin 帅哥哟,离线,有人找我吗?
      
      
      等级:大二期末(数据结构考了98分!)
      文章:30
      积分:433
      门派:XML.ORG.CN
      注册:2007/10/22

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给liangbin发送一个短消息 把liangbin加入好友 查看liangbin的个人资料 搜索liangbin在『 Web挖掘技术 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看liangbin的博客68
    发贴心情 
    从大的方向上看虽然千差万别,但内在的功夫其实是相通的,
    数据库的顶级会议SIGMOD,可以看到很多论文也都是搜索领域相关的,或者其他可能一眼并不觉得于数据库有十分紧密关系的论文。

    实验室女生做学问的是很多的,而且成果并不差,因此不要太在意自己是女生,而不适合计算机,兴趣是最好的老师。

    以下是引用天涯咫尺之遥在2008-10-21 9:09:00的发言:
    现在我才确定自己的方向
    我导师是做数据库的,所以我现在选择了存储的方向,但我对无线通信这个方向也特别有兴趣,所以想以后能做无线通信方面的数据库,梁老师,感觉这个方向怎样呢?
    以前总觉得女孩子不适合搞计算机,突然发现了自己的优势,我英语还不错,比较善于跟同学沟通,还有就是我得逻辑思维能力还是可以的,性别的劣势反而能成为我的优势,这是我的想法。

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/10/21 12:49:00
     
     天涯咫尺之遥 美女呀,离线,快来找我吧!
      
      
      等级:大一新生
      文章:8
      积分:98
      门派:XML.ORG.CN
      注册:2007/11/17

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给天涯咫尺之遥发送一个短消息 把天涯咫尺之遥加入好友 查看天涯咫尺之遥的个人资料 搜索天涯咫尺之遥在『 Web挖掘技术 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看天涯咫尺之遥的博客69
    发贴心情 恩  我在看了
    最近一直在看sigmod上的文章,觉得对自己提升了不少,知识面拓展的比较快,谢谢 梁老师不辞辛苦的指教
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/10/21 13:20:00
     
     amoysem 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:4
      积分:70
      门派:XML.ORG.CN
      注册:2008/10/21

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给amoysem发送一个短消息 把amoysem加入好友 查看amoysem的个人资料 搜索amoysem在『 Web挖掘技术 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看amoysem的博客70
    发贴心情 
    希望能够从梁老师那边学到更多的知识
    不知道梁老师对企业在搜索引擎营销,有什么见解呢?
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/10/22 21:01:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 Web挖掘技术 』 的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/4/27 18:13:18

    本主题贴数78,分页:[1] ... [4] [5] [6] [7] [8]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    156.250ms