新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     >>计算机科学论坛<<     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> 本版讨论Semantic Web(语义Web,语义网或语义万维网, Web 3.0)及相关理论,如:Ontology(本体,本体论), OWL(Web Ontology Langauge,Web本体语言), Description Logic(DL, 描述逻辑),RDFa,Ontology Engineering等。
    [返回] 计算机科学论坛W3CHINA.ORG讨论区 - Web新技术讨论『 Semantic Web(语义Web)/描述逻辑/本体 』 → 一篇对做reasoning和semantic search的同行均有借鉴意义的文章 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 5670 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: 一篇对做reasoning和semantic search的同行均有借鉴意义的文章 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     whfcarter 帅哥哟,离线,有人找我吗?
      
      
      
      威望:9
      等级:计算机学士学位(贵宾)
      文章:143
      积分:2145
      门派:XML.ORG.CN
      注册:2005/3/8

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给whfcarter发送一个短消息 把whfcarter加入好友 查看whfcarter的个人资料 搜索whfcarter在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看whfcarter的博客楼主
    发贴心情 一篇对做reasoning和semantic search的同行均有借鉴意义的文章



    上传了一篇今年Fensel和Frank今年3月份在IEEE Computer Society上发表的paper 名为"Unifying Reasoning and Search to Web Scale",意思就是阐述了一个原先Reasoning的种种限制,而现今当我们scale到open web环境中时需要注意的一些问题以及可以采取的方案,同时也指出了一些可以结合的研究领域(e.g. Machine learning, Information Theory, Game Theory等),其中的vision是值得我们思考的,同时也预示着欧洲在这个方面特别是FP7框架下的研究方向。
    p.s. EU FP7 下的项目LarCK (Large Knowledge Collider)其实与上述的vision基本一致,详细信息可以看http://www.sti-innsbruck.at

       收藏   分享  
    顶(0)
      




    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/12/18 18:05:00
     
     Leon.Essence 帅哥哟,离线,有人找我吗?
      
      
      
      威望:9
      等级:大四寒假(收到Microsoft的Offer啦)(贵宾)
      文章:129
      积分:1409
      门派:W3CHINA.ORG
      注册:2005/9/4

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给Leon.Essence发送一个短消息 把Leon.Essence加入好友 查看Leon.Essence的个人资料 搜索Leon.Essence在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 点击这里发送电邮给Leon.Essence 引用回复这个贴子 回复这个贴子 查看Leon.Essence的博客2
    发贴心情 
    不错的文章,昨天刚刚看完,顶一个!

    ----------------------------------------------
    做个勤奋者,思考者,更要做个偏执狂!

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/12/18 20:25:00
     
     zhaonix 帅哥哟,离线,有人找我吗?
      
      
      威望:2
      头衔:博士
      等级:研一(日夜苦读RDF Semantics)
      文章:242
      积分:3185
      门派:W3CHINA.ORG
      注册:2005/4/18

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给zhaonix发送一个短消息 把zhaonix加入好友 查看zhaonix的个人资料 搜索zhaonix在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 点击这里发送电邮给zhaonix 引用回复这个贴子 回复这个贴子 查看zhaonix的博客3
    发贴心情 
    “(为了适应web范围内的严酷的可扩展性要求,借鉴经济学中对行为主体的“有限理性”的假设)The basic idea is to select a random sample of any number of triples and reason with them. This method scales to any size.”
    ——真是有趣而又激进,感谢楼主推荐。

    另外,这篇是发在《IEEE Internet Computing》的 :) ——一个似乎偏重应用的互联网新技术杂志,IEEE Computer Society是它的主办单位。

    以下是引用whfcarter在2007-12-18 18:05:00的发言:


    上传了一篇今年Fensel和Frank今年3月份在IEEE Computer Society上发表的paper 名为"Unifying Reasoning and Search to Web Scale",意思就是……

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/12/19 9:59:00
     
     maomaogougou 帅哥哟,离线,有人找我吗?巨蟹座1979-6-28
      
      
      等级:大一(猛啃高等数学)
      文章:12
      积分:125
      门派:XML.ORG.CN
      注册:2007/7/2

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给maomaogougou发送一个短消息 把maomaogougou加入好友 查看maomaogougou的个人资料 搜索maomaogougou在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看maomaogougou的博客4
    发贴心情 
    不错不错,我的毕业论文作本体推理,正好参考参考!
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/12/19 11:33:00
     
     whfcarter 帅哥哟,离线,有人找我吗?
      
      
      
      威望:9
      等级:计算机学士学位(贵宾)
      文章:143
      积分:2145
      门派:XML.ORG.CN
      注册:2005/3/8

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给whfcarter发送一个短消息 把whfcarter加入好友 查看whfcarter的个人资料 搜索whfcarter在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看whfcarter的博客5
    发贴心情 
    to zhaonix 我不觉得很激进,因为我也在思考如何整合reasoning到web scale上,也得出和fensel类似的结论。 Fensel说的算是对现在logic based reasoning 中assumption的relax,fully rational agent 对应complete knowledge base, limited rational agent对应incomplete knowledge base(在这里主要说sampling). 借鉴了machine learning中关于sampling的解释,intelligent sampling is an interesting work for semantic web, which can learn a lot from machine learning.
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/12/19 11:52:00
     
     zhaonix 帅哥哟,离线,有人找我吗?
      
      
      威望:2
      头衔:博士
      等级:研一(日夜苦读RDF Semantics)
      文章:242
      积分:3185
      门派:W3CHINA.ORG
      注册:2005/4/18

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给zhaonix发送一个短消息 把zhaonix加入好友 查看zhaonix的个人资料 搜索zhaonix在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 点击这里发送电邮给zhaonix 引用回复这个贴子 回复这个贴子 查看zhaonix的博客6
    发贴心情 
    我时这么想的:Information retrieval和 DB query原本是两个不同的东西。前者面对结构化程度很低的数据,获得的结果可能既不完全、也不正确;后者正好相反,查询的结果一定是符合查询语句要求的,所以不存在precision和recall的问题。各种逻辑的reasoning应该也属于后一种情况,或许做不到complete,但sound是能保证的。
        而经过Fensel他们和你这么一结合后,query、reasoning的这个特点丧失了——不能保证结果sound了、更不用说completeness——和IR之间的界限模糊了。所以我觉得是激进。
        我在想:既然跟IR比起来没有特点了,那就得拼结果质量了:recall/precision。希望对于结构化数据(RDF dataset,符合某个RDFS/OWL本体),这种新方法可以获得比IR更高的查准率和查全率,同时在效率上不要低于IR太多。

    以下是引用whfcarter在2007-12-19 11:52:00的发言:
    to zhaonix 我不觉得很激进,因为我也在思考如何整合reasoning到web scale上,也得出和fensel类似的结论。 Fensel说的算是对现在logic based reasoning 中assumption的relax,fully rational agent 对应complete knowledge base, limited rational agent对应incomplete knowledge base(在这里主要说sampling). 借鉴了machine learning中关于sampling的解释,intelligent sampling is an interesting work for semantic web, which can learn a lot from machine learning.

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/12/20 8:51:00
     
     whfcarter 帅哥哟,离线,有人找我吗?
      
      
      
      威望:9
      等级:计算机学士学位(贵宾)
      文章:143
      积分:2145
      门派:XML.ORG.CN
      注册:2005/3/8

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给whfcarter发送一个短消息 把whfcarter加入好友 查看whfcarter的个人资料 搜索whfcarter在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看whfcarter的博客7
    发贴心情 
    to zhaonix, 我想补充3点
    1) IR与logic等并不是对立的,其实早在上世纪70年代,IR领域的鼻祖级人物Van rijsbergen就首先提出了logic-based approach for information retrieval, 其中将document corpus看作一个KB,整个search过程转换成为给定一个query,看是否KB可以entail这个query,当时还是比较盛行boolean IR的,所以这个想法也很自然。不过由于大家意识到光用keyword对于information need的刻画有限,ranking成为了很重要的问题,同时logic-based method自身的性能效率问题以及对于数值计算存在的先天不足,从而渐渐从人们的视野中淡去。同时DB和IR也不是完全独立的,如果有兴趣可以关注一下sigmod 2005上面关于DB+IR的panel,就在说两者的优劣,以及如何互补,同时从06年开始一种新的search environment dataspace也悄然出现。
    2) 其实inconsistency, incompleteness等在非经典逻辑(如非单调逻辑)中都有所探讨,同时原本的entailment也可以变成近似entailment. 各种logic的扩展e.g. probability logic, fuzzy logic and possibility logic都被广泛研究,并用来刻画知识库以及对知识库查询等各个方面的不确定性,不完整性甚至不一致性。并且这里扩展的logic也正在被用于建立各种search问题中的data model以及刻画之上的retrieval过程,如果有兴趣可以看一下zhanglei师兄在WWW2005上的paper, an enhanced search model for semantic portal,这个是基于fuzzy ALC的。
    3) 现在semantic search并没有现成的benchmark, LUBM也是为reasoning而设置的,所以到底用什么metrics现在没有定论,当然我们可以直接利用IR的P/R, 不过是否合适semantic search不一定,而且semantic web里面很重要的一块就是large scale data management,而structure的信息作为meta data等也是与传统IR不同的一个因素(entity view vs. document view)。
    希望我的补充对大家有用把!
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/12/20 22:04:00
     
     zhaonix 帅哥哟,离线,有人找我吗?
      
      
      威望:2
      头衔:博士
      等级:研一(日夜苦读RDF Semantics)
      文章:242
      积分:3185
      门派:W3CHINA.ORG
      注册:2005/4/18

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给zhaonix发送一个短消息 把zhaonix加入好友 查看zhaonix的个人资料 搜索zhaonix在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 点击这里发送电邮给zhaonix 引用回复这个贴子 回复这个贴子 查看zhaonix的博客8
    发贴心情 
    以下是引用whfcarter在2007-12-20 22:04:00的发言:
    to zhaonix, 我想补充3点
    ……
    希望我的补充对大家有用把!


    非常有用!多谢whfcarter指出的这几个重要的信息。回头去看

    只是,我还是有疑问:虽然叫法不同,在模糊逻辑、概率逻辑下的逻辑结论,与IR的结果条目,这两者在用户看来会不会没什么区别?——都是不能像DB查询的结果条目一样准确的近似结果。

    不过,疑问归疑问,我觉得lz介绍的这个方向还是十分有趣,值得探索。大家努力啊!

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/12/21 10:15:00
     
     whfcarter 帅哥哟,离线,有人找我吗?
      
      
      
      威望:9
      等级:计算机学士学位(贵宾)
      文章:143
      积分:2145
      门派:XML.ORG.CN
      注册:2005/3/8

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给whfcarter发送一个短消息 把whfcarter加入好友 查看whfcarter的个人资料 搜索whfcarter在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看whfcarter的博客9
    发贴心情 
    其实IR发展到现在ranking不仅仅是因为无法精确的描述information need或者无法匹配到相关的结果那么简单,有很多时候考虑的是relevance。而这点其实也是现在DB想从IR这里借鉴的,因为DB会遇到too many answers的问题,而且如果scale到整个web上,我只要给用户展现最相关和重要的top-k个结果就可以了。所以ranking不是不精确,而是区分不同结果的质量和重要性。有兴趣的话可以参考一下ISWC2003 AIFB的工作ranking semantic web results以及ICDE 2007 MPI实验室的NAGA还有washington turing lab的相应工作。
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/12/21 14:36:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2025/10/9 11:49:30

    本主题贴数9,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    89.844ms