新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     >>计算机科学论坛<<     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> 本版讨论Semantic Web(语义Web,语义网或语义万维网, Web 3.0)及相关理论,如:Ontology(本体,本体论), OWL(Web Ontology Langauge,Web本体语言), Description Logic(DL, 描述逻辑),RDFa,Ontology Engineering等。
    [返回] 计算机科学论坛W3CHINA.ORG讨论区 - Web新技术讨论『 Semantic Web(语义Web)/描述逻辑/本体 』 → 本体建设的方法论(读书摘要) 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 8680 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: 本体建设的方法论(读书摘要) 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     stranger88 帅哥哟,离线,有人找我吗?
      
      
      等级:大三(面向对象是个好东东!)
      文章:45
      积分:644
      门派:XML.ORG.CN
      注册:2005/7/12

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给stranger88发送一个短消息 把stranger88加入好友 查看stranger88的个人资料 搜索stranger88在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看stranger88的博客楼主
    发贴心情 本体建设的方法论(读书摘要)

    一、 本体建设的方法论
    1. Mike Ushold & Micheal Gruninger的 Skeletal Methodology(骨架法)[12]
    他们提出的建设本体的方法包括如下步骤:
     识别目的和范围(Identify Purpose and Scope)
    这个阶段需要弄清楚为什么要建立本体?建好后的用途有哪些?使用该本体的用户范围是什么?等。

     建设本体(Building the Ontology)
     本体捕获(ontology capture)
    本体捕获包括:(1)相关领域中关键概念和关系的识别;(2)这些概念和关系的精确无二义的文本定义的产生;(3)表达这些概念和关系的术语的识别;(4)在以上三点上达成一致。这一过程再细分为以下步骤:
    1> Scoping:
    a) 通过头脑风暴法(Brainstorming)产生所有潜在相关的术语和短语。
    b) 进行分组(Grouping):对应于自然产生的子组,将这些术语松散地组成工作区(Structure the terms loosely into work areas corresponding to naturally arising sub-groups)。
    2> Produce Definitions
    a) 决定下一步做什么?
    i. 决定元本体(Determining Meta-Ontology):先不急于提交任何的元本体,而是仔细考虑概念和它们的内部关系,尽量考虑各种可能性。
    ii. 工作区(Work Areas):依次考虑每个工作区。首选那种和其他工作区有最多的语义重叠的先作。
    iii. 术语(Terms):采用了middle-out的方法。首先定义每个工作区中最基本的术语,再定义更抽象或者更具体的。
    b) 达成一致
    i. 处理二义性的术语(Handling Ambiguous Terms):选定一个合适的术语来表达这种概念,避免使用二义性的术语。
    ii. 指导方针(Guidelines):产生一个自然语言文本的定义;确保一致性;指出关系;避免环状定义的术语;提供必要的补充信息使术语的定义更有效;在合适的地方给出例子。
    iii. 造词(Wording):权衡技术准确性和清晰。
    3> Review
    4> Meta-Ontology:设计一个元本体。
     本体编码(ontology coding)
    该阶段是利用某种形式化语言显式地表现上个阶段的概念化成果。涉及到:(1)作为meta-ontology的基本术语的确定;(2)选择一种表现语言(能够支持meta-ontology);(3)编码。
     集成现有本体(integrating existing ontologies)
    在达成一致方面有很多工作需要完成。
     评价(Evaluation)
    并没有提出自己的评价方法。《引用了Gomez-Perez关于evaluation的定义,需要参见更多的文章》。
     文档化(Documentation)
    目前很多知识库和本体缺少文档也是一种知识共享的障碍,这些文档应该包括本体中定义的主要概念、meta-ontology等。
    某些编辑器可以自动生成这些文档。
     每阶段的指导方针(Guidelines for each phase)
    把设计本体的初始的指导方针总结为以下设计标准(重点在于共享和重用):清楚(Clarity)、一致(Coherence)、可扩展性(Extensibility)、最小本体的承诺(Minimal ontological commitment)、最小的编码偏差(Minimal encoding bias)。

    2. Micheal Gruninger & Mark. S Fox的企业建模法(TOVE)
    TOVE Ontology Project是多伦多大学Enterprise Integration Laboratory的一个项目,它的目标是建立一套为商业和公共企业建模的集成本体,并且已经建成了相关本体。作为该项目的一部分,他们设计了一套创建和评价本体的方法“Enterprise Modelling Methodology”。该方法包括如下几个步骤[13]:


    1> 激发场景(Motivating Scenario)
    应用领域的某些场景激发了本体的建设,因此,给出一个场景有助于理解建设本体的动机。
    2> 非形式化的能力问题(Informal Competency Questions)
    提出一个本体应该能够回答的各种问题,作为需求。通过指明能力问题和场景之间的关系,可以对新扩展的本体进行一定的非形式化的判断。也是一种初始的评价,来判断是否需要扩展本体,或者现有本体是不是已经可以涵盖所提出的非形式化问题。
    3> 一阶逻辑表达的术语规格说明(Specification in first-Order Logic-Terminology)
    识别领域中的对象,并用一阶逻辑等方式表达出本体中的术语。
    4> 形式化的能力问题(Formal Competency Questions)
    用形式化的术语把非形式化的能力问题定义出来。
    5> 一阶逻辑表达的公理规格说明(Specification in first-Order Logic-Axioms)
    本体中的公理指定了术语的定义以及约束。采用本体中的谓词将公理定义为一阶逻辑的句子。这只是本体的规格说明,并不是本体的实现。
    6> 完备性定理(Completeness Theorems)
    当能力问题都被形式化的表述之后,必须定义在什么条件下这些问题的解决方案是完备的。

    在[12]中去掉了一阶逻辑作为描述语言的限制,把该方法表达成:
    1> 动机的确定(Capture of motivating scenarios)
    2> 非形式化能力问题的形式化(Formulation of informal competency questions)
    3> 采用一种形式化语言编写该本体术语的规格说明书(Specification of the terminology of the ontology within a formal language such as first-order logic)
    4> 使用该本体的术语把非形式化的能力问题形式化(Formulation of formal competency questions using the terminology of the ontology)
    5> 采用形式化语言编写关于该本体中术语的公理和定义的规格说明书(Specification of axioms and definitions for the terms in the ontology within the formal language)
    6> (Justification of the axioms and definitions by proving characterisation theorems)

    3. Mariano Fernandez & GOMEZ-PEREZ等的“METHONTOLOGY”[14]
    在介绍METHONTOLOGY之前,本文简单介绍了一下本体的开发过程和生命周期。作者总结本体的开发过程包括如下活动:计划(plan)、详细说明(specify)、获取知识(capturing knowledge)、概念化(conceptualize)、形式化(formalize)、集成(integrate)、实现(implement)、评价(evaluate)、文档化(documentation)、维护(maintain)。本体的生命周期依次分为以下状态:详细说明(specification)、概念化(conceptualization)、形式化(formalization)、集成(integration)、实现(implementation)和维护(maintenance)。下图表现了这些活动和状态之间的关系。

    作者称METHONTOLOGY方法是结合了骨架法和GOMEZ-PEREZ方法(也是本文作者之一,该方法参照下图右边所示,只是METHONTOLOGY的前身,不再论述)后,提出的一种更为通用的本体建设方法。

    METHONTOLOGY是一种建设本体的结构化方法,介绍如下:
    1> 规格说明书(Specification)
    该阶段要产生一份以自然语言编写的非形式化的、半形式化的、或者形式化的本体规格说明书。至少包括以下信息:本体的目的(预期的用途、场景和最终用户等)、实现本体的形式化程度、范围(包括要表达的术语集、它们的特性和粒度)。
    虽然无法确保规格说明书的完整性,但是必须保证一个好的本体规格说明书应该满足以下性质:
     简洁(每个术语都是相关的,没有无关或者重复的术语)
     部分完整性(术语的覆盖范围、每个术语的问题和粒度)
     一致性(每个术语及含义都在领域内有意义)
    2> 知识获取(Knowledge Acquisition)
    知识的来源很多,可以是:专家、书籍、手册、数字、表格、甚至是其他的本体。从这些数据源获得知识的关联技术包括:头脑风暴法、访谈、文本的形式化或非形式化的分析和一些知识获取工具。
    3> 概念化(Conceptualization)
    该活动将领域知识组织成概念模型,用规格说明书中识别的领域词汇表描述问题和解决方案。生成的概念模型允许最终用户(a)确定一个本体是否有用,并且对于某个给定应用不需要查看源代码就是可用的(b)比较数个本体的范围、完整性、可重用性、共享性。
    4> 集成(Integration)
    重用别的本体中已经建好的定义时,可以:
    a) 查看元本体,选择适合自己概念模型的。
    b) 选择和自己概念模型中的语义和实现一致的术语定义。
    5> 实现(Implementation)
    用任何一种形式化的语言编码实现本体。需要一套开发环境的支持,至少包括:词法和语法分析器、翻译器、编辑器、浏览器、搜索器、评价器、自动维护工具。
    6> 评价(Evaluation)
    评价是指在本体生命周期的每个阶段和阶段之间,利用某种参考框架对本体、软件环境、文档进行技术判断。评价包括正确性(verification)和有效性(validation)。
    7> 文档化(Documentation)
    在本体建设的全过程中每个阶段都应该有对应的文档。
    4. Alexander Maedche等的Cyclic Acquisition Process[15]

    Maedche有一系列关于从文本中抽取领域本体的文章,提出了这种本体获取的方法论,它是一种环状的结构。
    1> 环形的起点是一个通用的核心本体的选择。
    任何大型的通用本体(像Cyc、Dahlgren的本体)、词汇-语义网(像WordNet, GermaNet)、或者领域相关的本体(像TOVE)都可以作为这个过程的开始。选定基础本体后,用户必须确定用于抽取领域相关实体的文本。
    2> 从选择的文本中获取领域相关的概念,并建立概念之间的分类关系。
    3> 除去领域无关的概念,只留下和领域相关的。这时,建立起了目标本体的概念结构。
    4> 从基础本体中会继承一些关系,其他的关系需要通过学习的方法从文本中抽取。
    5> 对得到的领域相关的本体进行评价,还可以进一步的重复上述过程。
    5. IDEF-5方法[16]
    IDEF的概念是在70年代提出的结构化分析方法的基础上发展起来的。在1981年美国空军公布的ICAM: integrated computer aided manufacturing工程中首次用了名为“IDEF”的方法。IDEF是ICAM DEFinition method 的缩写,到目前为止它已经发展成了一个系列。本体描述获取方法IDEF5(Ontology Description Capture Method)提供了两种语言形式,即图表语言和细化说明语言来获取某个领域的本体论。这两种语言是互为补充的,IDEF5的图表语言在表达能力的某些方面是很有限的,但是它的这种绘图式方式又使得它很直观,容易被理解;而IDEF5的细化说明语言是一种具有很强的表达能力的文本语言,它可以把隐藏在图表语言内的深层次的信息描述清楚,从而可以弥补图表语言的不足。另一方面,IDEF家族中的方法都是互相补充的, 而在一个概念模型的描述中会遇到很多的相继发生的事件,即一个过程。那么对这些过程的描述也需要有一个很好的支持语言,IDEF3(Process Flow and Object State Description Capture Method)正是一种为获取对过程的准确描述所用的方法。它提供过程流图和对象状态转移网图(OSTN)这两种图表来获取,管理和显示过程。
    IDEF-5提出的本体建设方法包括以下五个活动:
    1> 组织和范围(Organizing and Scoping)
    确定本体建设项目的目标、观点和语境,并为组员分配角色。
    2> 数据收集(Data Collection)
    收集本体建设需要的原始数据。
    3> 数据分析(Data Analysis)
    分析数据,为抽取本体作准备。
    4> 初始化的本体建立(Initial Ontology Development)
    从收集的数据当中建立一个初步的本体。
    5> 本体的精炼与确认(Ontology Refinement and Validation)
    完成本体建设过程。
    以下是个人的看法:
    从本体的概念和作用我们可以看出,本体建设应该是工程化生产。工程思想的核心有两点:标准化的表达方式和规范化的工作步骤。软件工程就使得软件生产从程序员的个人劳动提高成为有组织的、可控制的工程,从而大幅度的从根本上提高了软件开发的效率和质量。相比于一般的软件,本体更强调共享、重用,它本身的出现就是为了给不同系统之间提供一种统一的语言,因此它的工程性更为明显。目前本体工程这个思路虽然已经被大家所接受,但是并没有出现成熟的方法论作为支持。上述的各种方法论也是诞生在具体的本体建设项目之中,在相应的项目中得到实践。这些方法之间并没有太大的差别,并且都和软件工程中常见的开发过程相类似。我们可以综合一下这几种方法,从而制定自己的一套方法论。

    [此贴子已经被作者于2005-8-2 16:14:39编辑过]

       收藏   分享  
    顶(0)
      




    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/7/23 21:13:00
     
     iamwym 帅哥哟,离线,有人找我吗?
      
      
      
      威望:9
      等级:计算机硕士学位(版主)
      文章:2454
      积分:17456
      门派:XML.ORG.CN
      注册:2004/11/14

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给iamwym发送一个短消息 把iamwym加入好友 查看iamwym的个人资料 搜索iamwym在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 访问iamwym的主页 引用回复这个贴子 回复这个贴子 查看iamwym的博客2
    发贴心情 
    原创么?
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/7/23 22:37:00
     
     boycott2 帅哥哟,离线,有人找我吗?
      
      
      等级:大一(猛啃高等数学)
      文章:7
      积分:147
      门派:XML.ORG.CN
      注册:2005/6/2

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给boycott2发送一个短消息 把boycott2加入好友 查看boycott2的个人资料 搜索boycott2在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看boycott2的博客3
    发贴心情 
    不错
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/7/26 22:31:00
     
     champion_wyd 帅哥哟,离线,有人找我吗?
      
      
      等级:大一(猛啃高等数学)
      文章:18
      积分:136
      门派:XML.ORG.CN
      注册:2005/7/17

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给champion_wyd发送一个短消息 把champion_wyd加入好友 查看champion_wyd的个人资料 搜索champion_wyd在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看champion_wyd的博客4
    发贴心情 
    8错!
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/7/28 14:44:00
     
     baggiozsu 帅哥哟,离线,有人找我吗?
      
      
      等级:大一(猛啃高等数学)
      文章:9
      积分:111
      门派:XML.ORG.CN
      注册:2004/12/6

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给baggiozsu发送一个短消息 把baggiozsu加入好友 查看baggiozsu的个人资料 搜索baggiozsu在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看baggiozsu的博客5
    发贴心情 
    还可以啊,呵呵
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/7/30 11:16:00
     
     zhuhailing 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:8
      积分:83
      门派:XML.ORG.CN
      注册:2005/8/2

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给zhuhailing发送一个短消息 把zhuhailing加入好友 查看zhuhailing的个人资料 搜索zhuhailing在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看zhuhailing的博客6
    发贴心情 
    请问楼主,有这方面的书吗?
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/8/2 15:35:00
     
     babyblue 美女呀,离线,快来找我吧!
      
      
      等级:大二(研究C++)
      文章:32
      积分:246
      门派:W3CHINA.ORG
      注册:2005/6/5

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给babyblue发送一个短消息 把babyblue加入好友 查看babyblue的个人资料 搜索babyblue在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 点击这里发送电邮给babyblue  引用回复这个贴子 回复这个贴子 查看babyblue的博客7
    发贴心情 
    能不能把你的资料共享一下?先谢谢了
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/8/2 16:04:00
     
     stranger88 帅哥哟,离线,有人找我吗?
      
      
      等级:大三(面向对象是个好东东!)
      文章:45
      积分:644
      门派:XML.ORG.CN
      注册:2005/7/12

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给stranger88发送一个短消息 把stranger88加入好友 查看stranger88的个人资料 搜索stranger88在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看stranger88的博客8
    发贴心情 我 已经不该篇文章上传上去了。8月2号
    书到没有,我 已经把该篇文章上传上去了。8月2号
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/8/2 16:25:00
     
     zhuhailing 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:8
      积分:83
      门派:XML.ORG.CN
      注册:2005/8/2

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给zhuhailing发送一个短消息 把zhuhailing加入好友 查看zhuhailing的个人资料 搜索zhuhailing在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看zhuhailing的博客9
    发贴心情 
    传哪儿了,我怎么找不到啊
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/8/3 14:08:00
     
     stranger88 帅哥哟,离线,有人找我吗?
      
      
      等级:大三(面向对象是个好东东!)
      文章:45
      积分:644
      门派:XML.ORG.CN
      注册:2005/7/12

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给stranger88发送一个短消息 把stranger88加入好友 查看stranger88的个人资料 搜索stranger88在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看stranger88的博客10
    发贴心情 
    上传的日期为 2005-8-2 16:51,主题是----本体建设的方法论(  共享   )
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/8/4 10:56:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2025/10/5 5:25:41

    本主题贴数15,分页: [1] [2]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    109.375ms