新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     >>计算机科学论坛<<     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> 关于 XML 的一般性技术讨论,提供 XML入门资料 和 XML教程
    [返回] 计算机科学论坛XML.ORG.CN讨论区 - XML技术『 XML基础 』 → 概要xml 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 3291 个阅读者  浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: 概要xml 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     diegor 帅哥哟,离线,有人找我吗?白羊座1979-4-10
      
      
      威望:4
      等级:大二(研究C++)|大二(研究汇编)
      文章:266
      积分:806
      门派:XML.ORG.CN
      注册:2004/3/3

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给diegor发送一个短消息 把diegor加入好友 查看diegor的个人资料 搜索diegor在『 XML基础 』的所有贴子 引用回复这个贴子 回复这个贴子 查看diegor的博客楼主
    发贴心情 概要xml

    ---以往的HTML由于难以扩展、交互性差、语义性差以及单向的超链接等缺点使其在电子数据交换、数据库与搜索引擎等领域的应用存在着障碍,而XML的出现就是为了解决这些问题。XML是一种元语言,可以定义其他的语言,并且它的标记是用户定义的,从理论上讲,其类型的数量可以是无限的。XML的前景被人看好,在21世纪,XML语言将成为世人皆知的“世界语”。
      ----在当今的IT行业,XML越来越成为一个热门的话题。我们知道,Web上的通用语言是HTML,正是由于它的出现,Internet才像现在这样如此深入人心,规模也变得异常庞大。也正因为如此,问题出现了,人们越发觉得HTML不够用了。1996年,W3C开始对HTML的后续语言进行研究,并于1998年2月正式推出了XML。以下是XML相关的一些话题。 XML的优势
      ----正如上面提到的,XML出现的原因主要是HTML不够用。我们至少可以罗列出下列这些HTML的不足:
      ----1.难以扩展
      ----HTML是符合SGML语法的一种固定格式的超文本标记语言,因其格式固定,故难以扩展。浏览器供应商通过非标准的扩展来获得市场份额,这就破坏了Web的交互操作性。
      ----XML的诞生正是为了解决这个问题,从其全称“扩展标记语言”(ExtensibleMarkupLanguage)就可以知道这一点。XML是SGML的一个子集,一个摒弃了其中一些复杂性并考虑到适合Web特性的一个子集。所以它和SGML一样,都是元语言,可以定义其它的语言。HTML4.0现在由SGML描述,将来可能由XML重新定义。所以,HTML的标记是固定的,只有如H1、P、Table等在HTML标准DTD中定义的标记。而XML的标记是用户定义的,所以从理论上讲,其类型的数量可以是无限的。
      ----2.交互性差 ----用户需要与应用进行交互,而使用HTML却并不容易做到。频繁的请求处理已经使现在的Web服务器不堪重负了,动态HTML可以把一些处理交给浏览器,但在这方面它远不及XML。更为重要的是,当我们想对同一数据以不同的视角进行观察时,HTML的办法是请求服务器重传另一个页面,这无疑更加重了服务器的负担。而如果使用XML,我们可以在本地排序、过滤和进行其他的数据操作。
      ----3.语义性差
      ----HTML最初是被设计用来标记文档以反映其结构的(如Title、H1、L1、P、Table等),同时它也包含一些用于显示格式的标记(如B、I),再加上超文本链接,HTML在Web上获得了巨大的成功。由于HTML没有考虑语义性,因此它至少在以下三个方面存在极大的不足:
      ----(1)电子数据交换(EDI)
      ----在HTML中,产品名和产品价格可能隐藏在文档的任何地方,没有任何特别之处,计算机无法将其从文档识别出来,因此也就谈不上对其进行更深入的处理。而XML可以将产品名和产品价格用类似PRODUCT_NAME和PRODUCT_PRICE的标记将它们标记出来,这样种种不同的应用就能理解它们的含义并进行相应的处理。XML实际上带来的是一场EDI技术的革命,因为它彻底弥补了商业规则和数据的内容与结构密不可分的传统EDI的缺陷。
      ----(2)数据库
      ----要在HTML中展示数据库中的数据,一般的过程是:通过某种手段从数据库中取出数据,然后将它们写到用于展示的HTML文档中,加上各种标记,提交给用户。这样做的结果就是用户得到一些“死”数据。即使用户仅仅想以另外一种方式浏览数据,也只能重来一次。而XML提供了极大的灵活性,我们可以把数据库中的每个字段和XML中的相应标记对应起来,如此带来的好处是不言而喻的。
      ----(3)搜索引擎
      ----相信每个使用过搜索引擎的人都有过同样的体会,返回的结果太多,你需要足够的耐心和时间去检查哪些是你需要的结果。问题在于现在的搜索引擎只能检索单词的频率、文档的标题以及某些情形下描述页面内容的元标记等,这是HTML的缺陷带来的限制。而在XML中,像〈AUTHOR〉这样的标记很明确地表达了它包含的意义,如果我们查找张某某写的书,而张某某又是被〈AUTHOR〉所标记,搜索引擎就可以很清楚地知道我们表达的语义而返回正确的结果。
      ----4.单向的超链接
      ----虽然现在HTML提供的超文本链接机制被证明是很有用的并取得了巨大的成功,但这种机制的如下特征注定了它的局限性:
      ----(1)超链接在它的某一端(源端)定义。
      ----(2)超链接确定了它的另一端(目的端),虽然服务器可以有很大的自由度来寻找和创建它的目的端。
      ----(3)用户只能从源端出发走到目的端。
      ----(4)超链接的效果由浏览器而不是由超链接本身来决定。举例来说,当用户打开一个链接时,一般的情形是用目的端的文档来取代源端的文档,浏览器可能提供一个选择让用户在一个新窗口中打开。
      ----实际上在早些的一些专用的超媒体系统中已经有一些更灵活的机制来表达更复杂的链接关系,如多个目的端,多向链接等,XML足以满足这样的需求。 应用领域
      ----我们从W3C公布的XML的设计目标就可以大致推测出XML的应用领域,XML的前三个设计目标是:
      ----(1)XML可直接在Internet上使用。
      ----(2)XML应支持广泛的不同种类的应用。
      ----(3)XML应和SGML兼容。
      ----用一句话来描述,就是XML应用于文档的制作和发布。具体来说,XML可广泛应用于Internet、出版业、电子商务等当今热门的市场。每个行业的组织和开发人员都可用XML创建他们自己的标识语言,用于在他们各自的领域中实现信息的交互,如音乐、化学、电子、登山、财务、冲浪、石油、地质、语言、烹调、历史、工程、数学等等。实际上,W3C已经正式发布了SMIL(SynchronizedMultimediaIntegrationLanguage),MathML(MathematicalMarkupLanguage),其他的一些组织也在开发各自领域的基于XML的标记语言。 相关的标准
      ----XML1.0是W3C于1998年2月正式发布的标准(以建议书的形式发布的,以下同),它是一个关于标记和属性的规范,除此之外,还有一些相关的标准来支持XML的广泛应用。XML最新的版本可在http://www.w3.org/TR/REC-xml下找到,最近的版本是http://www.w3.org/TR/1998/REC-xml-19980210。
      ----·XLink(XMLLinkingLanguage)
      ----关于XML扩展链接的标准,目前该标准还在制定之中。最新的版本可在http://www.w3.org/TR/xlink下找到,最近的版本是http://www.w3.org/1999/07/WD-xlink-19990726。
      ----·XPath(XMLPathLanguage)
      ----为XSLT和XPointer提供了一种公用的语法和语义机制,用于XML内部结构寻址。最新的版本可在http://www.w3.org/TR/xpath下找到,最近的版本是http://www.w3.org/TR/1999/REC-xpath-19991116。
      ----·XPointer(XMLPointerLanguage)
      ----关于XML文档的内部结构寻址的标准,它是建立在XPath的基础上一种语言,HTML中相应的机制是片段标识符。最新的版本可在http://www.w3.org/TR/WD-xptr下找到,最近的版本是http://www.w3.org/1999/07/WD-xptr-19990709。
      ----·XSLT(XSLTransformations)
      ----把一种XML结构的文档转换成另一种XML结构的语言,主要和XSL一起使用,用于把原始XML文档转换为使用XSL专用的格式化词表的XML文档。最新的版本可在http://www.w3.org/TR/xslt下找到,最近的版本是http://www.w3.org/TR/1999/REC-xslt-19991116。
      ----·XSL(ExtensibleStylesheetLanguage)
      ----XML的格式化描述语言,它对CSS的功能有所扩展而又摒弃了DSSSL的复杂性。XML文档的表现分为两步:第一步,用XSLT对XML源文档进行转换,第二步,用XSL对结果文档进行解释和表现。最新的版本可在http://www.w3.org/TR/WD-xsl下找到,最近的版本是http://www.w3.org/TR/1999/WD-XSL-19990421。
      ----·CSS(CascadingStyleSheets)
      ----另外一种格式化描述语言,主要用于HTML,但在不需要XSLT进行转换的情况下,XML文档可以使用CSS。最新的版本可在http://www.w3.org/TR/REC-CSS2下找到,最近的版本是http://www.w3.org/TR/1998/REC-CSS2-19980512,目前W3C正在讨论研究CSS3(level3)。
      ----·XHTML(TheExtensibleHyperTextMarkupLanguage)
      ----一个对HTML4.0再生、子集化和扩展的文档类型的家族,这种类型的文档是符合XML语法并最终可以用于基于XML的浏览器的,XHTML1.0是这个家族的第一个文档类型,它对HTML4.0的文档进行重新表达,然后将其作为XML1.0的一个应用,它适用于基于XML的浏览器。如果遵从某些准则的话,它也适用于基于HTML的浏览器。最新的版本可以在http://www.w3.org/TR/xhtml1下找到,最近的版本是http://www.w3.org/TR/1999WD-xhtml2-19991124。
      ----·DOM(DocumentObjectModel)
      ----对文档结构的标准化的内部表示,目的是让编程人员可以方便地访问文档的元素,删除、增加和编辑文档的内容、属性和风格等,其最大的特点是平台独立性和语言中立性。
      ----W3C现在已完成的工作是level1,它建立在NetscapeNavigator3.0和MicrosoftInternetExplorer3.0所实现的功能(被称为level0)基础上,适用于XML和HTML。其最新的版本可在http://www.w3.org/TR/REC-DOM-Level-1下找到,最近的版本是http://www.w3.org/TR/1998/REC-DOM-Level-1-19981001。W3C现在正着手level2的工作,并已规划到level3甚至更深。
      ----·Namespaces
      ----一个XML文档可能包含被不同的DTD或其他机制定义的元素和属性,这就难免产生识别和冲突的问题,XMLNamespaces使用URL的机制来解决这个问题。最新的版本可在http://www.w3.org/TR/REC-xml-names下找到,最近的版本是http://www.w3.org/TR/1999/REC-xml-names-19990114。
      ----·RDF(ResourceDescriptionFramework)
      ----关于元数据的标准,它是处理元数据的基础。RDF十分强调Web资源的自动处理,可应用于多个领域,如搜索引擎,资源分类编目,知识共享及交流,网页的著作权描述等。该标准引进了一个表示元数据的模型和用于编码和传输元数据的语法规则,其中语法由XML表达,因此XML和RDF是互为补充的。最新的版本可在http://www.w3.org/TR/REC-rdf-syntax下找到,最近的版本是http://www.w3.org/TR/1999/REC-rdf-stntax-19990222。
      ----·RDFSchema(ResourceDescriptionFrameworkSchema)
      ----RDF定义了一个用命名的属性和值的方法来描述资源间的关系的简单模型,RDF的属性值就是代表资源间的关系,这类似数据库技术中的E-R图。但是这个模型既没有提供声明这些属性的机制,也没有提供定义这些属性和资源之间的关系的机制,RDFSchema的任务就在于此。最新的版本可在http://www.w3.org/TR/PR-rdf-schema下找到,最近的版本是http://www.w3.org/TR/1999/PR-rdf-schema-19990303。
      ----·XMLSchema
      ----对XML文档的结构进行描述和内容进行限制的语言,它包含XML的DTD提供的全部功能并有所扩展,它本身用XML来表达。目前的版本由XMLSchemaPart1:Structures和XMLSchemaPart2:Datatypes两部分组成。最新的版本可分别在http://www.w3.org/TR/xmlschema-1和http://www.w3.org/TR/xmlschema-2下找到,最近的版本是http://www.w3.org/TR/1999/WD-xmlschema-1-19991105和http://www.w3.org/TR/1999/WD-xmlschema-2-19991105。
      ----·CanonicalXML ----对XML文档进行规范化的标准。两个在外在表现形式上(如实体结构、属性的顺序和字符的编码等)不同的XML文档可能在许多应用中是等价的,称之为“逻辑等价”。CanonicalXML就是一个将XML文档转换为其“逻辑等价”的规范化的XML文档的语法规则。最新的版本可在http://www.w3.org/TR/xml-cl4n下找到,最近的版本是http://www.w3.org/TR/1999/WD-xml-cl4n-19991115。
      ----·XMLSignatureCoreSyntaxandProcessing
      ----关于XML数字签名的语法和处理规则,它提供了一种对XML文档和其他Internet资源进行数字签名的机制,这种签名是用XML来进行编码的。最新的版本可在http://www.w3.org/TR/xmldsig-core下找到,最近的版本是http://www.w3.org/TR/1999/WD-xmldsig-core-19991119。
      ----·XMLFragmentInterchange
      ----XML标准支持可能由多个实体组成的逻辑文档,一个用户可能想浏览或编辑其中一些实体或实体的部分内容却对文档的其他部分没有兴趣和需求。XMLFragmentInterchange提供一种机制来传输用户需要的片段及片段所在的上下文关系。最新的版本可在http://www.w3.org/TR/WD-xml-fragment下找到,最近的版本是http://www.w3.org/1999/06/WD-xml-fragment-19990630.html。
      ----·XMLInformationSet ----关于XML信息集的标准,XML信息集是一个抽象的数据集,是对一个成形的(well-formed)XML文档可包含的信息的描述。最新的版本可在http://www.w3.org/TR/xml-infoset下找到,最近的版本是http://www.w3.org/TR/1999/WD-xml-infoset-19990517。
      ----在这里我们不可能将所有的标准都一一列出,它们大部分都还在进行当中,W3C目前甚至还没有关于它们的工作草案,如XMLSyntax、XMLQuery等,相对于HTML来说,XML是一个更庞大的家族。 XML的未来
      ----如果说HTML曾经为Internet开拓出一片新的天地,那么,XML将使这片天地变得更加令人心驰神往,并将大大拓展这片应用领域。但是,我们也必须看到,XML现状还仅仅停留在雾里看花的阶段,主流的浏览器中,只有IE5.0对XML提供有限的支持,尽管微软和Netscape公司都声称在他们下一个版本的浏览器中全面支持HTML4.0和XML,但这只有等待时间的证明了。可以预见的是,21世纪将是一个XML收获的季节,也许我们很快就会发现在主流的字处理器中包含这样一个选项——“存为XML格式”,那时,XML就是世人皆知的“世界语”了。

       收藏   分享  
    顶(0)
      





    关闭广告显示

    ----------------------------------------------
    坚决支持XML!

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2004/3/17 10:22:00
     
     GoogleAdSense白羊座1979-4-10
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 XML基础 』的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2025/7/27 16:51:39

    本主题贴数1,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    156.250ms