您的位置:首页 > 编程语言 > Java开发

java解析xml文件

2016-07-17 00:29 417 查看
       XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object Model),DTD(Document Type Definition),SAX(Simple API for XML),XSD(Xml Schema Definition),XSLT(Extensible
Stylesheet Language Transformations),具体可参阅w3c官方网站文档http://www.w3.org获取更多信息。

       XML在不同的语言里解析方式都是一样的,只不过实现的语法不同而已。基本的解析方式有两种,一种叫SAX,另一种叫DOM。SAX是基于事件流的解析,DOM是基于XML文档树结构的解析。

        在做一般的XML数据交换过程中,更多的是传递XML字符串,而不是格式化的XML Document。这就涉及到XML字符串和Xml Document的转换问题,说白了这是个很简单的问题,本文就各种XML解析器分别列举如下:

一、使用最原始的javax.xml.parsers,标准的jdk api

// 字符串转XML
String xmlStr = "......";

StringReader sr = new StringReader(xmlStr); 

InputSource is = new InputSource(sr); 

DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); 

DocumentBuilder builder=factory.newDocumentBuilder(); 

Document doc = builder.parse(is);

//XML转字符串

TransformerFactory  tf  =  TransformerFactory.newInstance();

Transformer t = tf.newTransformer();

t.setOutputProperty("encoding","GB23121");//解决中文问题,试过用GBK不行

ByteArrayOutputStream  bos  =  new  ByteArrayOutputStream();

t.transform(new DOMSource(doc), new StreamResult(bos));

String xmlStr = bos.toString();

这里的XML DOCUMENT为org.w3c.dom.Document

二、使用dom4j后程序变得更简单

// 字符串转XML

String xmlStr = "......";

Document document = DocumentHelper.parseText(xmlStr);

// XML转字符串 

Document document = ...;

String text = document.asXML();

这里的XML DOCUMENT为org.dom4j.Document

三、使用JDOM

JDOM的处理方式和第一种方法处理非常类似

//字符串转XML

String xmlStr = ".....";

StringReader sr = new StringReader(xmlStr);

InputSource is = new InputSource(sr);

Document doc = (new SAXBuilder()).build(is);

//XML转字符串

Format format = Format.getPrettyFormat();

format.setEncoding("gb2312");//设置xml文件的字符为gb2312,解决中文问题

XMLOutputter xmlout = new XMLOutputter(format);

ByteArrayOutputStream bo = new ByteArrayOutputStream();

xmlout.output(doc,bo);

String xmlStr = bo.toString();

这里的XML DOCUMENT为org.jdom.Document

四、JAVASCRIPT中的处理

//字符串转XML

var xmlStr = ".....";

var xmlDoc = new ActiveXObject("Microsoft.XMLDOM");

xmlDoc.async=false;

xmlDoc.loadXML(xmlStr);

//可以处理这个xmlDoc了

var name = xmlDoc.selectSingleNode("/person/name");

alert(name.text);

//XML转字符串

var xmlDoc = ......;

var xmlStr = xmlDoc.xml

这里的XML DOCUMENT为javascript版的XMLDOM

下节开始,将为大家介绍Java解析XML文件的四种经典方法,希望对大家有所帮助
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  java xml sax jdom dom4j