新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     >>计算机科学论坛<<     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> 本版讨论Semantic Web(语义Web,语义网或语义万维网, Web 3.0)及相关理论,如:Ontology(本体,本体论), OWL(Web Ontology Langauge,Web本体语言), Description Logic(DL, 描述逻辑),RDFa,Ontology Engineering等。
    [返回] 计算机科学论坛W3CHINA.ORG讨论区 - Web新技术讨论『 Semantic Web(语义Web)/描述逻辑/本体 』 → [求助]郁闷中!博士课题不知道怎么选? 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 20825 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: [求助]郁闷中!博士课题不知道怎么选? 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     ChouBill 帅哥哟,离线,有人找我吗?处女座1978-9-10
      
      
      威望:4
      等级:大三暑假(参加全国数模竞赛拿了一等奖)
      文章:124
      积分:774
      门派:XML.ORG.CN
      注册:2004/4/1

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给ChouBill发送一个短消息 把ChouBill加入好友 查看ChouBill的个人资料 搜索ChouBill在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 访问ChouBill的主页 引用回复这个贴子 回复这个贴子 查看ChouBill的博客11
    发贴心情 我的论文方向,大家多多指教

    我今年做博士论文,导师让我选本体方向的题目,我初步定下了这么一个题目——“SWOM网络本体模型及其应用研究”,大家讨论一下看看成不成吧。其实我的核心想法是,做一种本体模型出来,从理论上能解决目前本体存在的客观性和共享性问题,并围绕这个模型构造相应的本体描述语言OWL-SWOM、本体建构方法、本体相似度和相关度算法、本体查询语言SWOM-QL、以及一个本体的应用实例(智能答疑系统,由另一个博士完成,偏重自然语言分析)

    SWOM=Sememe-based Web Ontology Modal

    Tom Gruber曾经提到过本体表示应该遵循客观性原则。我们认为,如果本体建构是客观的,那么无论谁来建立,其结果都应该是一样的。但事实上不是这样的,在本体建构的过程中有时候很难保证其客观性。让不同人对同一个概念用形式化的方式进行描述,通常每个人都会有自己的描述方式。他们会根据自己的理解和偏好,为同一个概念设置不同的属性、性质甚至概念的上下位关系。本体的客观性问题会直接导致已经建成的本体难以被他人共享使用。这是违背了本体的初衷的,于是人们开始开发一些本体合并和本体集成工具来帮助实现本体的共享。但无论如何,这也只是一种事后补救的方法。另外,概念之间关系的直接标注还可能导致本体扩展起来比较麻烦,因为新增一个概念不仅要增加对这个概念本身的描述,通常还需要修改已经存在的概念以揭示新老概念之间的关系。

    SWOM的基本观点认为,义素是表达概念意义的最小单元,一个概念可以由若干个义素来表示,词汇是概念的人类语言载体,一个词汇通常有若干个义项,每个义项可以理解为一个概念。领域义素可以理解为某个领域内不可再分的核心概念,领域概念可以由领域义素来表示。因为在某个领域中概念数>>领域义素数,所以概念和概念之间的可能存在的关系总量要远大于概念和义素之间的关系总量。为了降低概念间关系标注的复杂性,我们不鼓励直接标注概念和概念之间的关系(显性关系),而是尽量只标注概念和义素之间的关系(隐性关系),通过隐性关系的标注让计算机自动推导出概念之间的显性关系。两种方法区别可以由下图体现:


    此主题相关图片如下:
    按此在新窗口浏览图片

    SWOM相对原来的本体直接标注有如下好处:
    1、同义、近义甚至上下位等关系可以通过计算得到,而不是直接标注,可以降低人对本体客观性的影响。
    2、在某个领域中,核心概念和隐性关系是可以共享使用的,相当一部分显性关系是可以由隐性关系推导出来,如果不够用的话,可以进一步标注显性关系,但不能保证新标注的显性关系的可共享性。
    3、可扩展性较好,要在一个已经建好的本体中增加或删除某个概念,可能会对已经建好的其它概念作出很多改动。这不符合对修改封闭、对扩展开放的面向对象思想。采用SWOM模型以后,无论是增加还是删除一个概念,都不需要对其它概念作出改动,因为概念只和义素(核心概念)发生关系。

    大家认为如何,请多提提宝贵意见吧,免得到时候不过就惨了

    ----------------------------------------------
    欢迎访问真人CS枪战论坛
    http://www.gunwar.cn

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/1/10 10:07:00
     
     npubird 帅哥哟,离线,有人找我吗?
      
      
      威望:9
      等级:大四寒假(收到Microsoft的Offer啦)
      文章:201
      积分:1965
      门派:XML.ORG.CN
      注册:2004/4/9

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给npubird发送一个短消息 把npubird加入好友 查看npubird的个人资料 搜索npubird在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看npubird的博客12
    发贴心情 
    以下是引用ChouBill在2005-1-10 10:07:51的发言:
    我今年做博士论文,导师让我选本体方向的题目,我初步定下了这么一个题目——“SWOM网络本体模型及其应用研究”,大家讨论一下看看成不成吧。其实我的核心想法是,做一种本体模型出来,从理论上能解决目前本体存在的客观性和共享性问题,并围绕这个模型构造相应的本体描述语言OWL-SWOM、本体建构方法、本体相似度和相关度算法、本体查询语言SWOM-QL、以及一个本体的应用实例(智能答疑系统,由另一个博士完成,偏重自然语言分析)

    SWOM=Sememe-based Web Ontology Modal

    Tom Gruber曾经提到过本体表示应该遵循客观性原则。我们认为,如果本体建构是客观的,那么无论谁来建立,其结果都应该是一样的。但事实上不是这样的,在本体建构的过程中有时候很难保证其客观性。让不同人对同一个概念用形式化的方式进行描述,通常每个人都会有自己的描述方式。他们会根据自己的理解和偏好,为同一个概念设置不同的属性、性质甚至概念的上下位关系。本体的客观性问题会直接导致已经建成的本体难以被他人共享使用。这是违背了本体的初衷的,于是人们开始开发一些本体合并和本体集成工具来帮助实现本体的共享。但无论如何,这也只是一种事后补救的方法。另外,概念之间关系的直接标注还可能导致本体扩展起来比较麻烦,因为新增一个概念不仅要增加对这个概念本身的描述,通常还需要修改已经存在的概念以揭示新老概念之间的关系。

    SWOM的基本观点认为,义素是表达概念意义的最小单元,一个概念可以由若干个义素来表示,词汇是概念的人类语言载体,一个词汇通常有若干个义项,每个义项可以理解为一个概念。领域义素可以理解为某个领域内不可再分的核心概念,领域概念可以由领域义素来表示。因为在某个领域中概念数>>领域义素数,所以概念和概念之间的可能存在的关系总量要远大于概念和义素之间的关系总量。为了降低概念间关系标注的复杂性,我们不鼓励直接标注概念和概念之间的关系(显性关系),而是尽量只标注概念和义素之间的关系(隐性关系),通过隐性关系的标注让计算机自动推导出概念之间的显性关系。两种方法区别可以由下图体现:


    此主题相关图片如下:
    按此在新窗口浏览图片

    SWOM相对原来的本体直接标注有如下好处:
    1、同义、近义甚至上下位等关系可以通过计算得到,而不是直接标注,可以降低人对本体客观性的影响。
    2、在某个领域中,核心概念和隐性关系是可以共享使用的,相当一部分显性关系是可以由隐性关系推导出来,如果不够用的话,可以进一步标注显性关系,但不能保证新标注的显性关系的可共享性。
    3、可扩展性较好,要在一个已经建好的本体中增加或删除某个概念,可能会对已经建好的其它概念作出很多改动。这不符合对修改封闭、对扩展开放的面向对象思想。采用SWOM模型以后,无论是增加还是删除一个概念,都不需要对其它概念作出改动,因为概念只和义素(核心概念)发生关系。

    大家认为如何,请多提提宝贵意见吧,免得到时候不过就惨了




    感觉思路很不错。
    先问个问题:感觉义素是核心。义素如何确定呢?领域专家?领域内制定的标准概念?如果这样的话,是否人的影响(即主观性)还是无法避免呢?

    如果不考虑关系,那么把现在的概念进行如下处理:将同义概念中的一个设定为义素,其它的则就通过与该义素的联系来表示;对多义词,可相似进行处理......
    这样得到的是义素吗?

    简单想了一下,很肤浅,呵呵

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/1/10 16:38:00
     
     iamwym 帅哥哟,离线,有人找我吗?
      
      
      
      威望:9
      等级:计算机硕士学位(版主)
      文章:2454
      积分:17456
      门派:XML.ORG.CN
      注册:2004/11/14

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给iamwym发送一个短消息 把iamwym加入好友 查看iamwym的个人资料 搜索iamwym在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 访问iamwym的主页 引用回复这个贴子 回复这个贴子 查看iamwym的博客13
    发贴心情 
    个人觉得这个思路不过不太可能的吧,呵呵。
    不过我觉得ontology要有一个模型,还确实是比较困难的东西,要是有一个建立的标准倒是很创新的东西,可是问题是能不能建立一个合理的模型了。
    现在有一些upper ontology,top ontology的概念,也算是建立Onotology遵守的准则了,不知道有没有重复的情况。
    顺便问一下,modal还是model?
    一点愚见~
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/1/11 5:56:00
     
     ChouBill 帅哥哟,离线,有人找我吗?处女座1978-9-10
      
      
      威望:4
      等级:大三暑假(参加全国数模竞赛拿了一等奖)
      文章:124
      积分:774
      门派:XML.ORG.CN
      注册:2004/4/1

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给ChouBill发送一个短消息 把ChouBill加入好友 查看ChouBill的个人资料 搜索ChouBill在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 访问ChouBill的主页 引用回复这个贴子 回复这个贴子 查看ChouBill的博客14
    发贴心情 
    楼上的两位兄弟提得很好,谢谢。

    核心概念的 确定 的确 是 这个思路的一个关键点,我还没有深入研究应该怎么去确定,但我觉得核心概念应该是领域概念中的一个最小集合,用它可以表达领域中的所有其它概念就可以。这里一个现实的例子是知网,他们用800个左右的义原就可以表示4万多条词汇。义素的确定当然需要依靠领域专家,但我觉得按照上面的大原则,无论是谁来做,无论采用什么方法,最终确定的义素总是会不断趋于相同。

    iamwym能告诉我为什么你觉得这个思路不太可能吗?

    upper ontology和top ontology好像还不是义素的概念,我理解他们是指比普通本体更加抽象的、通用程度较高的上层本体,例如时间、事件等。义素不比普通概念更加抽象,它只是一个领域内的核心概念集 。

    应该是model,谢谢。

    ----------------------------------------------
    欢迎访问真人CS枪战论坛
    http://www.gunwar.cn

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/1/11 9:53:00
     
     iamwym 帅哥哟,离线,有人找我吗?
      
      
      
      威望:9
      等级:计算机硕士学位(版主)
      文章:2454
      积分:17456
      门派:XML.ORG.CN
      注册:2004/11/14

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给iamwym发送一个短消息 把iamwym加入好友 查看iamwym的个人资料 搜索iamwym在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 访问iamwym的主页 引用回复这个贴子 回复这个贴子 查看iamwym的博客15
    发贴心情 
    upper ontology只是一种可能潜在的模型,你所提到义素,用英语怎么表示?
    我有点理解你要做什么了,那这样建立的模型,是在一个领域内的规范化概念和名词咯?这样看起来是完全可行的,似乎有点像编程当中用到的库函数,呵呵。
    我是觉得工作量似乎有点大,如果你要定义整一个域内的概念。而提出一个规范化的标准工作量少些,但是难度也就大了。
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/1/11 18:25:00
     
     ChouBill 帅哥哟,离线,有人找我吗?处女座1978-9-10
      
      
      威望:4
      等级:大三暑假(参加全国数模竞赛拿了一等奖)
      文章:124
      积分:774
      门派:XML.ORG.CN
      注册:2004/4/1

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给ChouBill发送一个短消息 把ChouBill加入好友 查看ChouBill的个人资料 搜索ChouBill在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 访问ChouBill的主页 引用回复这个贴子 回复这个贴子 查看ChouBill的博客16
    发贴心情 
    义素=sememe,比如皇帝emperor可以用human(人),occupation(职位),royal(皇)等核心概念来表示。

    工作量的确不小,而且要进行自然语言分析,可能这个本体库中不仅要有名词,还需要有动词、形容词等,如动词的配价信息、语义范畴,形容词的配价语义范畴等等。当然,对于博士论文来说我觉得只需要找一个领域做实验即可,并且动词形容词也只选用一些常见的。

    ----------------------------------------------
    欢迎访问真人CS枪战论坛
    http://www.gunwar.cn

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/1/12 9:36:00
     
     whale 帅哥哟,离线,有人找我吗?水瓶座1980-1-25
      
      
      威望:7
      等级:大四(GRE考了1600分!)(版主)
      文章:131
      积分:1300
      门派:XML.ORG.CN
      注册:2004/7/2

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给whale发送一个短消息 把whale加入好友 查看whale的个人资料 搜索whale在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看whale的博客17
    发贴心情 
    都是做语义核心技术的,俺们只能搞应用层面了!
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/1/12 10:56:00
     
     iamwym 帅哥哟,离线,有人找我吗?
      
      
      
      威望:9
      等级:计算机硕士学位(版主)
      文章:2454
      积分:17456
      门派:XML.ORG.CN
      注册:2004/11/14

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给iamwym发送一个短消息 把iamwym加入好友 查看iamwym的个人资料 搜索iamwym在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 访问iamwym的主页 引用回复这个贴子 回复这个贴子 查看iamwym的博客18
    发贴心情 
    sememe是linguistic上面的东东吧,自然语言处理方面我没什么发言权,不过这样看起来还是通过没问题的,加油咯。
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/1/13 1:12:00
     
     yangliu 帅哥哟,离线,有人找我吗?
      
      
      等级:大三(研究MFC有点眉目了!)
      文章:37
      积分:537
      门派:XML.ORG.CN
      注册:2004/9/29

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给yangliu发送一个短消息 把yangliu加入好友 查看yangliu的个人资料 搜索yangliu在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看yangliu的博客19
    发贴心情 想法很好!
    我也许明白了你的想法,你是想从一个外在的角度来表述Ontology中的概念,
    从而隐式的规定ontology中的其他要素。


    而Ontology的现状是用概念之间的上下位关系之类的简单办法来加以刻画。
    在这种现状之下,ontology是独立的,它几乎不需要依附于任何固有的东西。
    所以我们可以对某个Ontology赋予各种解释。
    也许你的方案可以通过对于义素的不同解释来达到类似的效果。

    从另一个角度来看,根据你所描述的内容,你预期的系统的描述能力要比
    现有的Ontology的描述能力高得多。而Ontology是要在描述能力和推理计算能力
    之间做一个权衡的(两者是一对矛盾)。所以我建议你在做之前,
    注意到Ontology的目标。

    欢迎和我讨论
    我的电子邮件是:yangliu@ustc.edu

    ----------------------------------------------
    子曰
    ——学而时习之
    ——有朋自远方来
    ——人不知而不愠

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/1/14 16:36:00
     
     ChouBill 帅哥哟,离线,有人找我吗?处女座1978-9-10
      
      
      威望:4
      等级:大三暑假(参加全国数模竞赛拿了一等奖)
      文章:124
      积分:774
      门派:XML.ORG.CN
      注册:2004/4/1

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给ChouBill发送一个短消息 把ChouBill加入好友 查看ChouBill的个人资料 搜索ChouBill在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 访问ChouBill的主页 引用回复这个贴子 回复这个贴子 查看ChouBill的博客20
    发贴心情 
    to yangliu:

        谢谢你的意见。其实我的预期描述能力并不比原来的方式更高,我想改进的主要是本体描述的客观性,客观性提高了那么本体的共享性问题自然可以得到提高。本体之所以存在的根本原因在于本体能促进知识共享,人们不必每次都从头开发知识库。目前很多单位都在做本体,但做出的本体很少有直接拿出去就能被别人共享使用的,原因领域中的概念、关系、性质、公理实在太多太复杂,不同单位不太可能达成共识。那么我的想法就是只取某个领域中的具有原始意义的最基本的核心概念、关系和公理,那么这些核心概念达成共识的可能性就会提高很多。

        这个模型的推理能力应该不会比原来的方式差,但推理时的计算性能确实是一个问题。但我认为计算性能可以通过改进本体查询和推理的接口得到解决。因为我们人工标注的是隐性关系(概念—义素关系),我们查询和推理需要的是显性关系(概念-概念关系),那么我们可以在标注隐性关系的同时让本体服务器预先推理出显性关系来并且加以缓存,这样我们在利用本体服务器查询和推理时仍然是利用显性关系来进行,这和原来没有什么两样,只不过在共享时共享的是隐性关系,更有利于共享。

        上面是我不成熟的见解,还望讨论提高。

    ----------------------------------------------
    欢迎访问真人CS枪战论坛
    http://www.gunwar.cn

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/1/17 10:33:00
     
     GoogleAdSense处女座1978-9-10
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/4/30 21:54:25

    本主题贴数21,分页: [1] [2] [3]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    101.563ms