新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     >>计算机科学论坛<<     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> 本版讨论Java, J2SE, J2ME, J2EE, 以及Eclipse, NetBeans, JBuilder等Java开发环境,还有JSP, JavaServlet, JavaBean, EJB以及struts, hibernate, spring, webwork2, Java 3D, JOGL等相关技术。
    [返回] 计算机科学论坛计算机技术与应用『 Java/Eclipse 』 → JDOM/XPATH编程指南 (转贴) 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 11320 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: JDOM/XPATH编程指南 (转贴) 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     mfc42d 帅哥哟,离线,有人找我吗?
      
      
      等级:大三暑假(ITELS考了6.5分!)(版主)
      文章:65
      积分:882
      门派:XML.ORG.CN
      注册:2004/6/13

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给mfc42d发送一个短消息 把mfc42d加入好友 查看mfc42d的个人资料 搜索mfc42d在『 Java/Eclipse 』的所有贴子 引用回复这个贴子 回复这个贴子 查看mfc42d的博客楼主
    发贴心情 JDOM/XPATH编程指南 (转贴)

    JDOM/XPATH编程指南    


       
    内容:

    前言
    XPATH速成篇
    JDOM修炼篇
    获得并安装JDOM
    用JDOM解析XML
    JDOM+XPATH进阶篇
    结语
    参考资料
    关于作者

    在 XML 专区还有:

    教学
    工具与产品
    所有的文章





    薛谷雨(rainight@126.com)
    NORDSAN信息科技开发有限公司高级JAVA工程师
    2004年5月

    前言

    XML是一种优秀的数据打包和数据交换的形式,在当今XML大行于天下,如果没有听说过它的大名,那可真是孤陋寡闻了。用XML描述数据的优势显而易见,它具有结构简单,便于人和机器阅读的双重功效,并弥补了关系型数据对客观世界中真实数据描述能力的不足。W3C组织根据技术领域的需要,制定出了XML的格式规范,并相应的建立了描述模型,简称DOM。各种流行的程序设计语言都纷纷根据这一模型推出了自己的XML解析器,在JAVA世界里,APACHE组织开发的XERCES应该是流行最广功能最为强大的XML解析器之一。但是由于W3C在设计DOM模型时,并不是针对某一种语言而设计,因此为了通用性,加入了许多繁琐而不必要的细节 ,使JAVA程序员在开发XML的应用程序过程中感到不甚方便,因此JDOM作为一种新型的XML解析器横空出世,它不遵循DOM模型,建立了自己独立的一套JDOM模型(注意JDOM决不是DOM扩展,虽然名字差不多,但两者是平行的关系),并提供功能强大使用方便的类库,使JAVA程序员可以更为高效的开发自己的XML应用程序,并极大的减少了代码量,因此它很快得到了业内的认可,如JBUILDER这样的航空母舰级的重磅产品都以JDOM为XML解析引擎,足见其名不虚传。

    有了XML数据的描述标准,人们自然就会想到应该有一种查询语言可以在XML中查找任意节点的数据,就像SQL语句可以在关系性数据库中执行查询操作一样,于是XQUERY和XPATH顺应潮流,应运而生。由于XQUERY较为复杂,使用不甚方便,XPATH渐渐成为主流,我们只需对XPATH进行学习,便可以应付所有的查询要求。在JDOM发布的最新的V1.0bata10版中,已经加入了对XPATH的支持,这无疑是令开发者十分激动的。

    学会JDOM和XPATH,你便不再是XML的入门者,在未来的开发生涯中,就像特种兵的多用匕首,为你披荆斩棘,助你勇往直前。闲言少叙,学习还要脚踏实地,从头开始。

    XPATH速成篇

    XPATH遵循文档对象模型(DOM)的路径格式,由于每个XML文档都可以看成是一棵拥有许多结点的树,每个结点可以是以下七个类型之一:根(root)、元素(element)、属性(attribute)、正文(text)、命名空间(namespace)、处理指令(processing instruction)和注释(comment)。XPATH的基本语法由表达式构成。在计算表达式的值之后产生一个对象,这种对象有以下四种基本类型:节点集合、布尔型、数字型和字符串型 。XPATH基本上和在文件系统中寻找文件类似,如果路径是以"/"开头的,就表明该路径表示的是一个绝对路径,这和在UNIX系统中关于文件路径的定义是一致的。以"//"开头则表示在文档中的任意位置查找。

    不谈泛泛的理论,学习XPATH还要从实例学起最为快捷,并有助于你举一反三。

    下面的样例XML文档,描述了某台电脑中硬盘的基本信息(根节点<HD>代表硬盘,<disk>标签代表硬盘分区,从它的name属性可以看出有两个盘符名称为"C"和"D"的分区;每个分区下都包含<capacity>,<directories><files>三个节点,分别代表了分区的空间大小、目录数量、所含文件个数):


    <?xml version="1.0" encoding="UTF-8"?>
    <HD>
     <disk name="C">
      <capacity>8G</capacity>
      <directories>200</directories>
      <files>1580</files>
     </disk>
     <disk name="D"> 
      <capacity>10G</capacity>
      <directories>500</directories>
      <files>3000</files> 
     </disk>
    </HD>

    你在XML文档中使用位置路径表达式来查找信息,这些表达式有很多种组成方式。

    结点元素的查找是你将要碰到的最频繁的查找方式。在上面这个XML文档例子中,根HD包含disk结点。你可以使用路径来查找这些结点,用正斜杠(/)来分隔子结点,返回所有与模式相匹配的元素。下面的XPATH 语句返回所有的disk元素:

    /HD/disk

    "*"代表"全部"的意思。/HD/* 代表HD下的全部节点。

    下面的XPATH将返回任意节点下的名称为disk的全部节点:

    //disk

    下面的XPATH将返回名称为disk,name属性为'C'的全部节点:

    /HD/disk[@name='C']

    节点的附加元素,比如属性,函数等都要用方括号扩起来,属性前面要加上@号

    下面的XPATH将返回文件个数为1580的files节点:

    /HD/disk/files[text()='1580']

    大家注意到上面包含一个text(),这就是XPATH的一个函数,它的功能是取出当前节点的文本。

    下面的XPATH将返回文件个数为1580的分区:

    /HD/disk/files[text()='1580']/parent::*

    最后的parent::*表示这个元素的所有的父节点的集合。

    XPATH中一些有用的函数:

    string concat(string, string, string*)  联接两个字符串  
    boolean starts-with(string, string)  判断某字符串是否以另一字符串开头  
    boolean contains(string, string)  判断某字符串是否包含另一字符串  
    string substring(string, number, number)  取子字符串  
    number string-length(string)  测字符串长度  
    number sum(node-set)  求和  
    number floor(number)  求小于此数的最大整数值  
    number ceiling(number)  求大于此数最小整数值  

    XPATH具有丰富的表达功能,上面这些已经基本够用,在你做项目中就会发现根据实际情况有许多查询需求,你应该参考本文最后提供的W3C发布的关于XAPH的官方资料进行查阅,我在这里只起一个抛砖引玉的作用,在下面的章节中,我们的应用范例将不会超出上面提到的这些内容,如果你对XPATH感兴趣,应该在读完本文后,查找相关资料和书籍进行深入学习。

    JDOM修炼篇

    用过XERCES的程序员都会感到,有时候用一句话就可以说清楚的事,当用XERCES的API来实现时,要三四行程序。

    获得并安装JDOM

    在http://www.jdom.org/ 可以下载JDOM的最新版本,将压缩包中的jdom.jar及lib目录下的全部jar包加入到classpath就可以了。

    用JDOM解析XML

    JDOM模型的全部类都在org.jdom.*这个包里,org.jdom.input.*这个包里包含了JDOM的解析器,其中的DOMBuilder的功能是将DOM模型的Document解析成JDOM模型的Document;SAXBuilder的功能是从文件或流中解析出符合JDOM模型的XML树。由于我们的上面提到的XML样例存储在一个名称为sample.xml的文件中,很显然我们应该采用后者作为解析工具。下面程序演示了jdom的基本功能,即解析一个xml文档,并挑选一些内容输出到屏幕上。


    import java.util.*;
    import org.jdom.*;
    import org.jdom.input.SAXBuilder;
    public class Sample1 {
     public static void main(String[] args) throws Exception{
      SAXBuilder sb=new SAXBuilder();
      Document doc=sb.build("sample.xml");
      Element root=doc.getRootElement();
      List list=root.getChildren("disk");
      for(int i=0;i<list.size();i++){
       Element element=(Element)list.get(i);
       String name=element.getAttributeValue("name");
       String capacity=element.getChildText("capacity");
       String directories=element.getChildText("directories");
       String files=element.getChildText("files");
       System.out.println("磁盘信息:");
       System.out.println("分区盘符:"+name);
       System.out.println("分区容量:"+capacity);
       System.out.println("目录数:"+directories);
       System.out.println("文件数:"+files);
       System.out.println("-----------------------------------");
      }  
     }
    }

    程序的输出结果:


    磁盘信息:

    分区盘符:C

    分区容量:8G

    目录数:200

    文件数:1580

    -----------------------------------

    磁盘信息:

    分区盘符:D

    分区容量:10G

    目录数:500

    文件数:3000

    -----------------------------------

    这段程序采用了传统的解析方式,一级一级的从根节点到子节点逐个采集我们所需要的数据,中规中矩。试想如果这个树足够深,我们想取第5 0层第三个节点的数据(夸张了点,呵呵),那将是一场噩梦!下面的内容将轻松化解你的这一痛苦。

    JDOM+XPATH进阶篇

    说了那么多JDOM和XPATH的好处,终于到了英雄有用武之地的时候了。

    JDOM的关于XPATH的api在org.jdom.xpath这个包里。看看这个包下,只有一个类,JDOM就是如此简洁,什么事都不故弄玄虚的搞得那么复杂。这个类中的核心的api主要是两个selectNodes()和selectSingleNode()。前者根据一个xpath语句返回一组节点;后者根据一个xpath语句返回符合条件的第一个节点。

    下面的程序我们用JDOM+XPATH实现了上一个程序同样的功能,你可以从中学到不少运用XPATH 的知识:


    import java.util.*;
    import org.jdom.*;
    import org.jdom.input.SAXBuilder;
    import org.jdom.xpath.XPath;
    public class Sample2 {  
     public static void main(String[] args) throws Exception {
      SAXBuilder sb = new SAXBuilder();
      Document doc = sb.build("sample.xml");
      Element root = doc.getRootElement();
      List list = XPath.selectNodes(root, "/HD/disk");
      for (int i = 0; i > list.size(); i++) {
       Element disk_element = (Element) list.get(i);
       String name = disk_element.getAttributeValue("name");
       String capacity = ( (Text) XPath.selectSingleNode(disk_element,
        "//disk[@name='" + name + "']/capacity/text()")).getTextNormalize();
       String directories = ( (Text) XPath.selectSingleNode(disk_element,  
        "//disk[@name='" + name + "']/directories/text()")).getTextNormalize();
       String files = ( (Text) XPath.selectSingleNode(disk_element,  
        "//disk[@name='" + name + "']/files/text()")).getTextNormalize();
       System.out.println("磁盘信息:");
       System.out.println("分区盘符:" + name);
       System.out.println("分区容量:" + capacity);
       System.out.println("目录数:" + directories);
       System.out.println("文件数:" + files);
       System.out.println("-----------------------------------");
      }
     }
    }

    输出结果:


    磁盘信息:

    分区盘符:C

    分区容量:8G

    目录数:200

    文件数:1580

    -----------------------------------

    磁盘信息:

    分区盘符:D

    分区容量:10G

    目录数:500

    文件数:3000

    -----------------------------------

    结语

    技术在日新月异的发展。永远没有学过后,便可以一劳永逸的技术。XML的发展一日千里。W3C作为INTERNET方面的权威组织指导着互联网技术的发展方向。新技术的出现大都围绕着W3C制订的标准,但往往有些“旁门左道”的另类功法却能产生惊人的杀伤力。JDOM就是这众多旁门中的一朵奇葩。就像J2EE大行其道的今天,有许多开源组织仍旧在默默的打造着自己的独家兵器,谁又能说在不久的将来,他们不会成为划时代的创造呢? 君不见Hibernate的兴起正在有力的震撼着J2EE中EJB架构的基石。只要是成型的框架,必然有薄弱的软肋。新的技术只要能攻入对方这一弱点,便可在业界站一席之地。本文只起抛砖引玉的作用,相信读者在吃过这道快餐之后,一定会发现窗外有更美丽的风景等待我们去游历。

    参考资料


    W3C发布的关于XPATH的权威文档请访问 http://www.w3.org/TR/2002/WD-DOM-Level-3-XPath-20020328
    JDOM官方网站可以下载最新JDOM类库 http://www.jdom.org

    关于作者

    薛谷雨是NORDSAN(北京)信息科技开发有限公司高级JAVA研发工程师,正致力于企业级异构数据交换的服务器产品的研发,在J2EE和WEB SERVICE方面有较为丰富的开发经验,你可以通过 rainight@126.com 与他取得联系。


       收藏   分享  
    顶(0)
      




    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2004/7/11 13:40:00
     
     xmzhy 帅哥哟,离线,有人找我吗?狮子座1978-8-18
      
      
      威望:5
      等级:计算机学士学位
      文章:385
      积分:2003
      门派:XML.ORG.CN
      注册:2003/10/22

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给xmzhy发送一个短消息 把xmzhy加入好友 查看xmzhy的个人资料 搜索xmzhy在『 Java/Eclipse 』的所有贴子 引用回复这个贴子 回复这个贴子 查看xmzhy的博客2
    发贴心情 
    see
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/4/2 9:38:00
     
     GoogleAdSense狮子座1978-8-18
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 Java/Eclipse 』的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/4/28 18:34:26

    本主题贴数2,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    132.813ms