新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     >>计算机科学论坛<<     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> 本版讨论Semantic Web(语义Web,语义网或语义万维网, Web 3.0)及相关理论,如:Ontology(本体,本体论), OWL(Web Ontology Langauge,Web本体语言), Description Logic(DL, 描述逻辑),RDFa,Ontology Engineering等。
    [返回] 计算机科学论坛W3CHINA.ORG讨论区 - Web新技术讨论『 Semantic Web(语义Web)/描述逻辑/本体 』 → [求助]求一篇语义网综述文章 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 4362 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: [求助]求一篇语义网综述文章 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     accipiter 帅哥哟,离线,有人找我吗?
      
      
      等级:大一(高数修炼中)
      文章:13
      积分:117
      门派:W3CHINA.ORG
      注册:2007/10/16

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给accipiter发送一个短消息 把accipiter加入好友 查看accipiter的个人资料 搜索accipiter在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看accipiter的博客楼主
    发贴心情 [求助]求一篇语义网综述文章

    The Semantic Web Vision:
    Whereare We?
    谢谢。

       收藏   分享  
    顶(0)
      




    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/10/17 12:52:00
     
     bzbc 帅哥哟,离线,有人找我吗?
      
      
      等级:大三暑假(TOFEL考了660分!)
      文章:151
      积分:921
      门派:XML.ORG.CN
      注册:2006/4/15

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给bzbc发送一个短消息 把bzbc加入好友 查看bzbc的个人资料 搜索bzbc在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看bzbc的博客2
    发贴心情 


    0 引 言
    随着互联网的飞速发展和广泛应用,其缺陷也逐渐暴露
    出来,如搜索引擎智能程度低,搜索出来的结果往往不是用户
    真正需要的,网页功能单调等等。互联网的创始人TimBerners-
    Lee于2000年12月18日在XML2000的会议上正式提出语义
    网。语义网的目标是使得Web上的信息具有计算机可以理解
    的语义,满足智能软件代理对万维网上异构和分布式信息的
    有效访问和搜索。2001年TimBemem.Lee为未来的Web发展
    提出了基于语义的体系结构,其各层内容及描述如表1所示。
    语义网的体系结构正在建设中,当前国际范围内对此体
    系结构的研究还没有形成一个另人满意的严密的逻辑描述与
    理论体系,我国学者对该体系结构也只是在国外研究的基础
    上做简要的介绍,还没有形成系统的阐述。
    1 语义网关键技术 ’
    在Tim Beme~-Lee的语义网模型中,第2、3、4层是语义
    Web的关键层,用于表示Web信息的语义,也是现在语义Web
    研究的热点所在。其中XML层作为语法层,RDF层作为数据
    层,本体层作为语义层。
    XML不仅提供对资源内容的表示,也提供资源所具有的
    结构信息。但仅有XML是不够的。XML页面上还包含大量
    表1 解析Tim Beme~.Lee的语义网结构
    层数 名称 描述
    低 整个语义Web的基础;Unicode(统一
    第1层 Unicode和URI 编码)处理资源的编码,URI(统一资
    源定位器)负责标识资源
    第2层 )a +NS+XML 用于表示数据的内容和结构
    Schema
    第3层 RDF+RDF Schema 用于描述Web上的资源及其类型
    第4层 Ontology v~ ulary 描述各类资源及资源之间的关系
    夕 第5层 L
    ogic 在下面4层的基础上进行逻辑推理操作
    高 第6层 Proof 根据逻辑陈述进行验证以得出结论
    第7层 Trust 在用户间建立信任关系
    其它信息,如图像、音频和说明性文字内容等,这些信息难以
    被智能软件代理处理。因此需要提供描述XML资源的元数
    据,也就是对所描述对象结构或内容所作的规范说明。RDF是
    W3C推荐的用于描述和处理元数据的方案,能为wleb上的应
    用程序间的交互提供机器能理解(或处理)的信息。它独立于
    任何语言,适用于任何领域,是处理元数据的基础。XML与
    RDF都能为所描述的资源提供一定的语义。问题是XML标
    签集和RDF中的属性集都没有任何限制,而且XML和RDF在
    处理语义上存在以下问题:① 同一概念有多种词汇表示;② 同
    一词汇有多种含义 为解决上述问题,很自然需要引入本体。
    本体通过对概念和概念之间关系的严格定义来确定概念的精
    收稿日期:2006.03-25 E-mail:jjlnt0455@sina.corn ’
    作者简介:李洁(198O一),女,江苏宿迁人,硕士研究生,研究方向为语义网、本体论与信息检索; 丁颖(1963-),女,副教授,硕士生导
    师,研究方向为网络、数据库。
    一1831—
    维普资讯 http://www.cqvip.com
    确含义,表示共同认可的、可共享的知识。因此,语义网的实
    现需要3大关键技术的支持:XML、RDF和Ontology。
    2 XM L
    XML-的目标是改变Web的基本结构,超越HTML并代之
    以更强大、更具有可扩展性的体系结构,它可以让信息提供者
    根据需要,自行定义标记及属性名,从而使XML文件的结构
    可以复杂到任意程度。它具有良好的数据存储格式和可扩展
    性、高度结构化以及便于网络传输等优点,再加上其特有的NS
    机制及XML Schema所支持的多种数据类型与校验机制,使其
    成为语义网的关键技术之一。
    2.1 XML简介
    可扩展标识语言(extensible markup language,xML),
    SGML、HTML是XML的先驱。通用标识语言标准(standard
    generalizedmarkuplanguage,SGML),它是国际上定义电子文件
    结构和内容描述的标准,是一种非常复杂的文档的结构,主要
    用于大量高度结构化数据的防卫区和其它各种工业领域,利
    于分类和索引。同XML相比,SGML定义的功能很强大,缺
    点是它不适用于Web数据描述,而且SGML软件价格非常价
    格昂贵。超文本标识语言(hypertext markup language,Hn他),
    它的优点是比较适合Web页面的开发。但它有一个缺点是标
    记相对少,只有固定的标记集如<p>.<strong>等,缺少SGML的
    柔性和适应,不能支持特定领域的标记语言,如对数学、化学、
    音乐等领域的表示支持较少。
    XML结合了SGML和HTML的优点并消除其缺点。XML
    不仅可以描述文档数据对象本身,还能部分描述如何处理这
    些数据,这使得它在应用集成领域可以大有作为。首先XML
    是一种元标记语言,所谓“元标记”就是开发者可以根据自
    己的需要定义自己的标记,比如开发者可以定义如下标记
    <bookXnamc>,任何满足XML命名规则的名称都可以标记,
    这就为不同的应用程序打开了大门。新创建的标记可在文档
    类型定义(document type definition,DTD)中加以描述。另外,
    XML也是一种语义/结构化语言。它描述了文档的结构和语
    义,用户可以很方便地定义自己领域的专用标记,文档的结构
    也可以是任意的。当XML文档被用于不同应用时,只需改变
    相应的表现形式,而不必修改文档本身。
    2.2 定义XML文档格式
    (1)使用文档类型定义(document type definition,DTD):
    DTD允许指定XML文档的基本结构。可以定义XML文档
    中出现的元素、这些元素出现的次序、它们可以如何相互嵌套
    以及XML文档结构的其它详细信息。
    (2)使用XML模式:模式可以定义能在DTD中使用的所
    有文档结构,它还可以定义数据类型和比DTD更复杂的规则。
    Schema用XML的语法定义XML文档的结构,因此易于理解。
    3 IU F
    资源描述框架(resource description framework,RDF)是
    W3C组织推荐使用的用来描述资源及其之间关系的语言规
    范,具有简单、易扩展、开放性、易交换和易综合等特点。RDF
    的目标是为Web资源描述提供一种通用框架,它以一种机器
    一1832 一
    可理解的方式被表示出来,可以很方便的进行数据交换,RDF
    提供了Web数据集成的元数据解决方案。
    3.1 RDF描述的内容
    RDF语言主要功能特征所描述的内容包括:
    (1)Resource:一类特定的信息条目,通常是一个Web站点:
    资源,通常以URL进行标识:
    (2)Class/Subclass:资源可以被分类,每个类以下都可以有
    许多小的下位类,由此形成了一个完整的分类体系;
    (3)Property:连接两个相关资源:
    (4)Domain/Range:一个Property中的两个资源可以受到限
    定,一个目标域以及目的文件范围会受到一个特定类的限制:
    (5)Container:资源集合可组织在Container中。Container包
    括:“集”,元素的“次序”按一定的顺序排列,及“其它的选择”。
    3.2 RDF Schema
    RDF与XML之间的关系非常紧密,事实上,它们之间是
    互补的:RDF的作用之一是以一种标准化的、具有互操作性的
    模式为基于XML的数据规定语义。RDF是一种元数据模型,
    而XML是一种语法格式。RDF数据模型可以用XML表示,
    也可以用其它语法格式描述。RDF Schema则是基于XML对
    RDF的一种实现。
    RDFSchema使用一种机器可以理解的体系来定义描述资
    源的词汇,其功能就像一个字典,可以将其理解为大纲或规范。
    RDF Schema的作用是:① 定义资源以及属性的类别:② 定义
    属性所应用的资源类以及属性值的类型;③定义上述类别声明
    的语法;④ 申明一些由其它机构或组织定义的元数据标准的
    属性类。
    4 Ontology
    Bemers.Lee所提出的语义网模型的第4层为本体层,
    是语义网技术里最关键的部分。本体的概念最初起源于哲学
    领域,是“对世界上客观存在物的系统地描述,即存在论”;如
    今本体应用于互联网研究领域,被定义成“本体是概念化的明
    确的规范说明”。一个本体描述了一个特定研究领域的一个
    形式化的、共享的概念化模型。本体非常适合于描述互联网
    上各种不同的、分散的、半结构化的信息资源。通过定义共享
    的、通用的领域理论,本体帮助人和机器明确的交流,支持语
    义级的交换,而不仅仅是语法级的。
    4.1 构造本体的规则
    在语义网中,本体具有非常重要的地位,是解决语义层次
    上Web信息共享和交换的基础。构建本体的方法是当前研究
    中的热点问题。本体的构建多是面向特定领域,如果没有好
    的方法路线指导,就难以在不同领域本体的构建中保持一致,
    也不利于本体的规模化和规范建设。
    出于对各自问题域和具体工程的考虑,构造本体的过程
    各不相同。目前没有一个标准的Ontology的构造方法。最有
    影响的是Gruber在1995年提出的5条规则:
    (1)明确性和客观性:本体应该用自然语言对所定义的术
    语给出明确、客观的语义定义;
    (2)完整性:给出的定义完整,能表达特定术语的含义;
    (3)一致性:知识推理产生的结论与术语本身的含义不会
    维普资讯 http://www.cqvip.com
    产生矛盾;
    (4)最大单向可扩展性:向本体中添加通用或专用的术语
    时,不需要修改已有的内容;
    (5)最少约束:对待建模对象给出尽可能少的约束。
    目前大家公认在构造特定领域本体的过程中需要领域专
    家的参与和协作。
    4.2 本体描述语言
    语义网使用XML来定义标签格式以及用RDF的灵活性
    来表达数据,下一步需要的就是一种本体的网络语言来描述
    网络文档中术语的明确含义和它们之间的关系。
    本体描述语言是用来描述本体的,它让用户可以为领域
    模型编写清晰、形式化的概念描述。事实上,本体描述语言起
    源于人工智能领域对知识表示的研究,因此本体的描述语言
    不仅仅需要具有良好定义的语法和语义,充分的表达能力,更
    需要有效的推理支持(包括计算复杂性和可判定性等)。大量
    的研究工作者活跃在该领域,因此诞生了许多种本体描述语
    言,简单把它们归类如下:
    和Web相关的有:RDF和RDFS、0IL、DAML、DAML+
    OIL、OWL、SHOE、XOL。其中RDF和RDFS、OIL、DAML、
    OWL 、XOL之间有着密切的联系,是W3C的本体语言栈中的
    不同层次,也都是基于XML的。而SHOE是基于HTML的,
    在HTML的一个扩展。
    和具体系统相关的(基本只在相关项目中使用的)有:ON.
    TOLINGUA、CYCL、L00M 。
    KIF已经是美国国家标准,但是它并没有被广泛应用于
    互联网,作为一种交换格式更多的应用于企业级。
    下面将就目前最流行的本体语言做进一步的分析。
    4.2.1 OIL和DAML
    OIL(ontology interchange language,ontology inference layer)
    是由斯坦福大学、荷兰阿姆斯特丹大学等多家机构从2000年
    开始联合开发,它所依托的项目是Ontoknowledge。作为一种
    推荐标准,具有合并和表示本体以及进行系统间交互两种功
    能。设计目的是为了提供最多的建模元语,可通用于基于框
    架和描述逻辑的本体。OIL为一个标准的本体语言指出了一
    个层次化的方法,每一增加层将在原来的层上增加功能性和
    复杂性。用OIL来描述本体,需要区分3个不同的层次。首
    先是对象级,这一级描述具体的本体;其次是第l元级,这一
    级提供了确定的本体定义,用一种定义良好的语义来描述结
    构化的词汇;最后是第2元级,这一级描述的是一个本体的元
    信息,如作者、名称和主题等。OIL目前的研究关注的是第l
    元级和第2元级,分别称之为本体定义和本体容器。
    DAML(DARPA agent markup language)由DARPA(美国国
    防部高级计划研究署)主持开发,力图溶入RDF、OIL等的优
    点,它与OIL一样建立在RDF之上,以描述逻辑为基础。其主
    要目标是开发一个旨在以机器可读的方式表示语义关系、并
    与当前及未来技术相容的语言,尤其是开发出一套工具与技
    术,使得Agent(代理)程序可以识别与理解信息源,并在Agent
    程序之间实现基于语义的互操作。DAML扩展了RDF,增加
    了更多的更复杂的类、属性等定义。它一度很流行,成为网上
    很多本体的描述语言,直到DAML的研究者和OIL的研究者
    开始合作,推出了DAML+OIL语言,成为W3C研究语言互联
    网的本体语言的起点。
    DAML+OIL是由美国和欧盟在DAML背景下共同开发
    的。它是RDF(s)基础上的扩展,具备充分的表达能力(如惟一
    性、传递性、逆反性、等价等),具有一定的推理能力,完全确定
    了语义网中知识表示语言的整体框架。国外已有多种支持
    DAML+OIL的工具软件,如:OILEd、WebODE等。
    4.2.2 O、ⅣL
    OWL(web ontology language)的最新版本2004年2月lO日
    由W3C组织正式发布,在DAML+OIL语言的基础上进行了改
    进。在OWL 的介绍中,OWL 语言的开发者指出:OWL 的开发
    目标不是针对人来描述Web信息内容,而是为了解决面向应
    用程序和环境之间的语义互操作的描述语言,它通过本体来
    表达词汇、术语的意义以及他们相互之间的关系。在表达概
    念的语义灵活性方面,OWL比过去的XML、RDF、RDF.S等语
    言都要强。OWL 是在DAML+OIL语言基础上的一个改进版
    本,过去DAML+OIL中的一些经验和教训对OWL的设计有
    很大的帮助,一些缺陷相应的在OWL中得到了改进。
    OWL有3个子语言,描述如下:
    OWL Lite:用于提供给那些只需要一个分类层次和简单
    的属性约束的用户。例子:支持基数,只允许基数为0或l。
    OWL DL:支持那些需要在推理系统上进行最大程度表达
    的用户,这里的推理系统能够保证计算完全性(即所有地结论
    都能够保证被计算出来)和可决定性(即所有的计算都在有限
    的时间内完成)。它包括了OWL 语言的所有约束,但是可以
    被仅仅置于特定的约束下。例子:当一个类可以是多个类的
    一个子类时,它被约束不能是另外一个类的实例。
    OWL Full:支持那些需要在没有计算保证的语法自由的
    RDF上进行最大程度表达的用户。它允许在~个本体在预定
    义的(RDF、0wL)词汇表上增加词汇,从而任何推理软件均不
    能支持OWLFull的所有特征。例子:一个类可以被同时表达
    为许多个体的一个集合以及这个集合中的一个个体。
    虽然目前有多个本体语言供研究者选择使用,但我们应
    该尽量选择已经有便利创建本体和评价资源工具的本体语言。
    5 结束语
    语义网是一个新兴的研究方向,其实现还是一个长期的
    过程,目前对于语义网的3个关键技术XML、RDF和Ontology
    的研究已开展了较长时间,研究成果相对较多,并推出了一系
    列标准。尤其是最重要的本体层研究,国外的本体理论研究日
    趋成熟,理论体系正逐步完善,已有为数不少的本体构建工具
    和方法体系,但没有一个是完全成熟的。国内对语义网的研究
    相对滞后,大多文章仍停留在翻译、综述国外研究的水平上,
    具有独立创新性的研究比较少。因此,今后我们对语义网的研
    究还要继续深入,研究的方向和重点问题包括:①语义网体系
    结构、建设方法等研究:① 语义网的实际应用研究:③XML、
    RDF的基础理论以及实际应用研究;④ 本体描述语言、本体构
    建工具与方法等研究;⑤本体的实际应用研究,建立具有一定
    实用价值的词汇集及推理机制,构建特定领域本体等。

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/10/17 13:42:00
     
     accipiter 帅哥哟,离线,有人找我吗?
      
      
      等级:大一(高数修炼中)
      文章:13
      积分:117
      门派:W3CHINA.ORG
      注册:2007/10/16

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给accipiter发送一个短消息 把accipiter加入好友 查看accipiter的个人资料 搜索accipiter在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看accipiter的博客3
    发贴心情 
    非常感谢^_^。
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/10/17 13:59:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2025/10/7 19:07:30

    本主题贴数3,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    687.500ms