以文本方式查看主题

-  计算机科学论坛  (http://bbs.xml.org.cn/index.asp)
--  『 XQuery/XLink/XPointer/ 』  (http://bbs.xml.org.cn/list.asp?boardid=14)
----  XML文档搜索使用小结  (http://bbs.xml.org.cn/dispbbs.asp?boardid=14&rootid=&id=36235)


--  作者:longshentailang
--  发布时间:7/30/2006 10:10:00 PM

--  XML文档搜索使用小结
XML文档搜索使用小结

http://www.51cto.com 2005-11-03 09:41 出处:51cto.com整理  

关键字:XML  搜索 28块砖  
强力砖:此为空地,我要占领!


大家在.NET中处理XML文档的时候,经常会需要找到文档中的某个节点的数据。要找到某个节点,有许多种方法,在这里我就把几种常用的方法给大家总结一下。

首先,我们要做的是要把一个XML文档装入到一个XmlDocument对象中去。

先引用几个名字空间:

using System.Xml;

using System.Xml.Xsl;

using System.Xml.XPath;

这几个名字空间大家根据名字就知道它的意思了,我就不在这儿多说了。然后就是装入XML文件的代码,方法如下:

String xmlfile="c:/member.xml"; //其中的xmlfile是你要载入的XML文件的路径。

XmlDocument myDoc = new XmlDocument(); //定义一个XmlDocument对象。

myDoc.Load(xmlfile);

这样,我们就有一个叫myDoc的XML文档。我们现在就来找这个文档中的一些节点。我们先来看这个XML文件的内容。

< ?xml version="1.0" encoding="UTF-8"?>

< members>

< member>

< name>Tim

< hobby>reading

< homepage>www.aspcool.com

< /member>

< member>

< name>Sandy

< hobby>learning

< /member>

< member>

< name>Shally

< hobby>tranlating

< /member>

< member>

< name>Christine

< hobby>working

< /member>

< /members>

我们现在可以用下面的方法找到name为tim的节点:

myDoc.ChildNodes.Item(1).ChildNodes.Item(0).FirstChild.InnerText

这个方法要求我们一层层向内找我们需要的数据,如果层次很多的话,做起来就会很费劲,也容易出错。幸好.NET给我们提供了另外一个方法SelectSingleNode和SelectNodes方法可以让我们直接找到所要的数据。比如,我们要找姓名为“Tim”的用户的hobby,我们可以用下面的方法:

myDoc.SelectSingleNode ("//member[name='Tim']").ChildNodes.Item(1).InnerText

其中//代表里面任意层的子节点。这样我们就可以很快的找到所要的东西。SelectSingleNode是找到一个单一的节点,SelectNodes可以找到许多节点。

在XML中寻找某个子节点,大家都知道怎么做了,我们现在在一个特殊的XML文件---XSL文件中去找一个子节点,这个应该怎么实现呢?

假设我现在有一个这样的XSL文件:

< ?xml version="1.0" encoding="gb2312"?>

< xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:fo="http://www.w3.org/1999/XSL/Format">

< xsl:preserve-space elements="codes"/>

< xsl:template match="/">

< xsl:apply-templates/>

< /xsl:template>

< xsl:template match="image">

< table align="{@location}">

< tr>

< td>

< img align="{@location}" alt="{text()}">

< xsl:attribute name="src">../FTP_Magazine/FTP_Issue/

< /img>

< /td>

< /tr>

< tr>

< td>

< center>

< xsl:apply-templates/>

< /center>

< /td>

< /tr>

< /table>

< /xsl:template>

< /xsl:stylesheet>

我们在asp.net中有两个变量,我们需要XSL文件在Transform XML文件的时候采用这两个变量。我们该如何去做呢?

我所采取的方法是先把XSL文件作为XML Document装载进来,在使用之前,我们找到需要修改的节点,用我们的变量对其进行修改。这个时候我们查找这个节点的时候需要做些变动,代码如下:

XmlNamespaceManager nsmanager = new XmlNamespaceManager(xslDoc.NameTable);

nsmanager.AddNamespace("xsl", "http://www.w3.org/1999/XSL/Transform");

xslDoc.SelectSingleNode("//xsl:attribute[@name='src']", nsmanager).InnerXml = 你所需要输给的变量

也就是说对于类似../FTP_Magazine/FTP_Issue/这样的节点,在我们查找以前,我们需要定义一个XmlNamespaceManager,用它我们就可以找到我们所需要的节点。


--  作者:longshentailang
--  发布时间:8/2/2006 10:00:00 PM

--  
如果大家还知道什么XML文档搜索技巧,可以拿出来与大家分享分享!或有其他好的文章,也可以贴出来,共同学习!
--  作者:Qr
--  发布时间:8/6/2006 7:15:00 PM

--  
LZ的方法是C#检索XML的一种常规方法,那就是将XML文档整个装入到一个XmlDocument对象中去,然后通过XmlDocument对象的方法结合XPath进行检索。这种方法只适用于小型XML文档的应用。

对于大型的XML文档,可以通过XmlReader读取XML,同时通过XmlWriter将其写出,成为一个新的文档对象。这种方法不会同时将XML整个读进内存,同时达到精确搜索的要求。只是实现的过程相对较难,新手不容易掌握,有时间的话,偶将代码整理出来,封装成为组件。


--  作者:longshentailang
--  发布时间:8/9/2006 2:58:00 PM

--  
学习了,期待版主能早日将代码整理出来,以便我们能较好掌握大型文档的检索方法。
W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
85.938ms