您的位置:首页 > 编程语言 > Java开发

DOM4J解析XML文档

2014-07-05 08:59 281 查看
DOM4J解析XML文档

Dom4j是一个简单、灵活的开放源代码的库。Dom4j是由早期开发JDOM的人分离出来而后独立开发的。与JDOM不同的是,dom4j使用接口和抽象基类,虽然Dom4j的API相对要复杂一些,但它提供了比JDOM更好的灵活性。 

Dom4j是一个非常优秀的Java XML API,具有性能优异、功能强大和极易使用的特点。现在很多软件采用的Dom4j,例如Hibernate,包括sun公司自己的JAXM也用了Dom4j。

使用Dom4j开发,需下载dom4j相应的jar文件。如果导入dom4j后运行程序时依然出现找不到某个类,可能原因是没有导入dom4j的依赖包。

 

注意:

SAXReader reader=new SAXReader();

Document document=reader.read(new File("src/book.xml"));

Dom4j读取完xml文档后在内存里会将内容编码装化为utf-8编码,输出时要注意io流FileWriter的默认编码(当前电脑默认)。可能会发生xml文档里encoding指定为utf-8,实际存入硬盘采用的码表却是gbk的乱码错误。

将文档写入XML文件时:

1.文档中全为英文,不设置编码,直接写入的形式.

  XMLWriter writer = new XMLWriter(new  FileWriter("output.xml"));

  writer.write(document);

  writer.close();

 

2.文档中含有中文,设置编码格式写入的形式.

OutputFormat format = OutputFormat.createPrettyPrint();

// 指定XML编码                   

     format.setEncoding("GBK");       

XMLWriter writer = new XMLWriter(newFileWriter("output.xml"),format);

writer.write(document);

writer.close();

 

DOM4j中,获得Document对象的方式有三种:

 

1.读取XML文件,获得document对象            

                   SAXReader reader = new SAXReader();

              Document   document = reader.read(new File("input.xml"));

 

2.解析XML形式的文本,得到document对象.

                   String text = "<members></members>";

              Document document = DocumentHelper.parseText(text);

 

3.主动创建document对象.

                  Document document = DocumentHelper.createDocument();

             //创建根节点

                  Element root = document.addElement("members");

 

 

字符串与XML的转换:

1.将字符串转化为XML

 

     String text = "<members> <member>sitinspring</member></members>";

Document document = DocumentHelper.parseText(text);

 

2.将文档或节点的XML转化为字符串.

     SAXReader reader = new SAXReader();

Document   document = reader.read(new File("input.xml"));            

Element root=document.getRootElement();    

            

String docXmlText=document.asXML();

String rootXmlText=root.asXML();

Element memberElm=root.element("member");

String memberXmlText=memberElm.asXML();

 

 

示例:

<?xml version="1.0" encoding="gb2312"?>

<书架>
<书>
<书名 name="dddd">java web就业</书名>
<作者>张孝祥</作者>
<售价>309元</售价>
<售价>309元</售价>
<售价>40</售价>
<售价>111</售价>
<售价>111</售价>
<售价>111</售价>
<售价>111</售价>
</书>
<书>
<书名 name="xxxx">C++教程</书名>
<作者>张三</作者>
<售价>50</售价>
</书>
</书架>
package cn.itcast.dom4j;

import java.io.File;
import java.io.FileOutputStream;
import java.io.FileWriter;
import java.io.OutputStreamWriter;
import java.util.List;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.SAXReader;
import org.dom4j.io.XMLWriter;
import org.junit.Test;

public class Demo1 {

public static void main(String[] args) throws Exception {
read();
}
//读第 2 本书的信息 <书名  name="xxxx">C++教程</书名>
private static void read() throws DocumentException {
SAXReader reader=new SAXReader();
Document document=reader.read(new File("src/book.xml"));
Element root=document.getRootElement();
Element book=(Element) root.elements("书").get(1);
String value=book.element("书名").getText();
String value2=book.element("书名").attributeValue("name");
System.out.println(value  +";"+value2);
}

//在第一本上添加一个新的售价
@Test
public void add() throws Exception{
SAXReader reader=new SAXReader();
Document document=reader.read(new File("src/book.xml"));
Element book=document.getRootElement().element("书");
book.addElement("售价").setText("111");
//XMLWriter writer=new XMLWriter(new FileWriter("src/book.xml"));
//XMLWriter writer=new XMLWriter(new OutputStreamWriter(new FileOutputStream("src/book.xml"), "UTF-8"));

OutputFormat format = OutputFormat.createPrettyPrint();
format.setEncoding("gb2312");
XMLWriter writer=new XMLWriter(new OutputStreamWriter(new FileOutputStream("src/book.xml"), "gb2312"),format);

writer.write(document);
writer.close();
}
//在第一本书指定位置上添加一个新的售价,更改List集合
@Test
public void add2() throws Exception{
SAXReader reader=new SAXReader();
Document document=reader.read(new File("src/book.xml"));

Element book=document.getRootElement().element("书");
List list=book.elements();//[书名,作者,售价]

Element price=DocumentHelper.createElement("售价");
price.setText("309元");
list.add(2,price);

OutputFormat format = OutputFormat.createPrettyPrint();
format.setEncoding("gb2312");
XMLWriter writer=new XMLWriter(new OutputStreamWriter(new FileOutputStream("src/book.xml"), "gb2312"),format);

writer.write(document);
writer.close();
}
//删除上面的节点
public void delete() throws Exception {
SAXReader reader=new SAXReader();
Document document=reader.read(new File("src/book.xml"));

Element price=document.getRootElement().element("书").element("售价");
price.getParent().remove(price);
}
//更新节点
@Test
public void update() throws Exception{
SAXReader reader=new SAXReader();
Document document=reader.read(new File("src/book.xml"));

Element book=(Element) document.getRootElement().elements("书").get(1);
book.element("作者").setText("张三");
OutputFormat format = OutputFormat.createPrettyPrint();
format.setEncoding("gb2312");
XMLWriter writer=new XMLWriter(new OutputStreamWriter(new FileOutputStream("src/book.xml"), "gb2312"),format);

writer.write(document);
writer.close();
}

}

Xpath:

/代表从根节点开始计算节点,表示绝对路径,//代表所有符合条件的节点,表示相对路径。*代表所有节点。

package cn.itcast.dom4j;

import java.io.File;
import java.io.FileOutputStream;
import java.io.FileWriter;
import java.io.OutputStreamWriter;
import java.util.List;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.SAXReader;
import org.dom4j.io.XMLWriter;
import org.junit.Test;

//应用xpath提取xml文档的数据,需要包jaxen-1.1-beta-6.jar
public class Demo4 {

public static void main(String[] args) throws Exception {
SAXReader reader = new SAXReader();
Document document = reader.read(new File("src/book.xml"));
String value = document.selectSingleNode("//作者").getText();// 第一个值
System.out.println(value);
}
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  java xpath dom4j xml