DOM文档操作和XML文档互相转换的java实现 (转贴)-JSP教程,Java和XML
来源:作者: 发布时间:2007-12-27 06:12:29

dom文档操作和xml文档互相转换的java实现

[ 作者: 郭洪锋   添加时间: 2001-10-19 8:16:09 ]




郭洪锋 (ghf_email@sohu.com)

简介:该文简要描述了dom的概念和内部逻辑结构,给出了dom文档操作和xml文档互相转换的java实现过程。
1. dom简介
现在,w3c已于2000年11月13日推出了规范dom level 2。文档对象模型(dom)是html和xml文档的编程接口规范,他和平台和语言是无关的,因而能够用各种语言在各种平台上实现。该模型定义了thml和xml文档在内存中的逻辑结构(即为文档),提供了访问、存取thml和xml文档的方法。利用dom规范,能够实现dom 文档和xml之间的相互转换,遍历、操作相应dom文档的内容。能够说,要自由的操纵xml文档,就要用到dom规范。

2. dom内部逻辑结构
dom文档中的逻辑结构能够用节点树的形式进行表述。通过对xml文档的解析处理,xml文档中的元素便转化为dom文档中的节点对象。dom的文档节点有document、element、comment、type等等节点类型,其中每一个dom文档必须有一个document节点,并且为节点树的根节点。他能够有子节点,或叶子节点如text节点、comment节点等。任何的格式良好的xml文档中的每一个元素均有dom文档中的一个节点类型和之对应。利用dom接口将xml文档转化成dom文档后,我们就能够自由的处理xml文档了。

3. java中的dom接口
dom规范提供的api的规范,现在sun公司推出的jdk1.4测试版中的java api遵循了 dom level 2 core推荐接口的语义说明,提供了相应的java语言的实现。

在org.xml.dom中,jkd1.4提供了document、documenttype、node、nodelist、element、text等接口,这些接口均是访问dom文档所必须的。我们能够利用这些接口创建、遍历、修改dom文档。

在javax.xml.parsers中,jkd1.4提供的doumentbuilder和documentbuilderfactory组合能够对xml文档进行解析,转换成dom文档。

在javax.xml.transform.dom和javax.xml.transform.stream中,jdk1.4提供了domsource类和streamsource类,能够用来将更新后的dom文档写入生成的xml文档中。

4. 例程

4.1 将xml文档转化成dom文档
这个过程是获得一个xml文档解析器,解析xml文档转化成dom文档的过程。

jdk1.4中,document接口描述了对应于整个xml文档的文档树,提供了对文档数据的访问,是该步骤的目标。document接口能够从类documentbuilder中获取,该类包含了从xml文档获得dom文档实例的api。xml的解析器能够从类documentbuilderfactory中获取。在jdk1.4中,xml文档转化成dom文档能够有如下代码实现:
//获得一个xml文档的解析器
documentbuilderfactory factory = documentbuilderfactory.newinstance();
//解析xml文档生成dom文档的接口类,以便访问dom。
documentbuilder builder = factory.newdocumentbuilder();
document = builder.parse( new file(filename) );



4.2 遍历dom文档
获得接口类document实例后,能够对dom的文档树进行访问。要遍历dom文档,首先要获得root元素。然后获得root元素的子节点列表。这里通过递归的方法实现遍历的目的。


//获得root元素
element element = document.getdocumentelement();
//获得root元素的子节点列表
nodelist = element.getchildnodes();
//用递归方法实现dom文档的遍历
getelement(nodelist);
其中getelement方法实现如下:
public void getelement(nodelist nodelist){
node cnode;
int i,len;
string str;

if(nodelist.getlength() == 0){
// 该节点没有子节点
return;
}
for(i=0;i 1)
system.out.println("      "+str+" "+len);
}
}
}

注意:上面的代码只是显示node类型和text类型的对象。他们的类型标识分别是1和3。

4.3 修改dom文档
修改dom文档的api在dom level 2 core规范中做了说明,jkd1.4中的org.xml.dom中实现了这些api。修改dom文档操作主要集中在document、element、node、text等类中,这里给出的例子中是在解析出的dom文档中增加一系列对象,对应和在xml文档中增加一条记录。
// 获得root对象
element root = document.getdocumentelement();
// 在dom文档中增加一个element节点
element booktype = document.createelement("computes");
//将该节点转化成root对象的子节点
root.appendchild(cdrom);
//在dom文档中增加一个element节点
element booktitle = document.createelement("title");
//将该节点转化成booktype对象的子节点
booktype.appendchild(booktitle);
//在dom文档中增加一个text节点
text bookname = document.createtextnode("understand corba");
//将该节点转化成bookname对象的子节点
booktitle.appendchild(bookname);



4.4 将dom文档转化成xml文档
// 获得将dom文档转化为xml文档的转换器,在jdk1.4中,有类transformerfactory
// 来实现,类transformer实现转化api。
transformerfactory tfactory = transformerfactory.newinstance();
transformer transformer = tfactory.newtransformer();
// 将dom对象转化为domsource类对象,该对象表现为转化成别的表达形式的信息容器。

domsource source = new domsource(document);
// 获得一个streamresult类对象,该对象是dom文档转化成的其他形式的文档的容器,能够是xml文档,文本文档,html文档。这里为一个xml文档。
streamresult result = new streamresult(new file(“text.xml”));
// 调用api,将dom文档转化成xml文档。
transformer.transform(source,result);


这里提供了该例程的完整程式,该例程在windows 2000中jdk1.4环境中运行通过。

以上给出了一个例子,读者能够从中了解到对dom操作的思路。因为对dom的操作均遵循了dom规范,所以也适用于其他语言对dom的处理。

参考资料:

http://www.w3.org/tr/2000/rec-dom-level-2-core-2000-1113
java 2 platform, standard edition, v1.4.0 api specificaion

关于作者
郭洪锋:主要从事unix系统下分布式应用的研发和研究。您能够通过电子邮件ghf_email@sohu.com 和他联系。

喜欢本文,那就收藏到:

    Del.icio.us Google书签 Digg Live Bookmark Technorati Furl Yahoo书签 Facebook 百度搜藏 新浪ViVi 365Key网摘 天极网摘 和讯网摘 博拉网 POCO网摘 添加到饭否 QQ书签 Digbuzz我挖网
相关评论  我也要评论
还没有关于此文章的相关评论!
  • 昵称: (为空则显示guest)
  • 评论分数: ★ ★ ★★★ ★★★★ ★★★★★
  • 评论内容:(不能超过250字,需审核后才会公布,请自觉遵守互联网相关政策法规。
  • 导航
    赞助商
    文章类别
    订阅
    Jordan Shoes christian audigier wholesale Nike air Jordan Jordan retro shoes wholesale Nike Shoes Wholesale Shoes Wholesale clothing