SAX PULL DOCUMENT解析XML总结
2015-12-14 10:52
393 查看
SAX解析
1.继承DefaultHandler类,重写startDocument、startElement、character、endElement、endDocument方法,startDocument在读取
2.用SAXParser或者XMLReader来解析
SAXParser解析:
XMLReader解析:
在解析时,一定要小心,不要忽略空白的地方,Sax解析器会把它认为是一个TextNod
PULL解析
与SAX类似,同样有START_DOCUMENT、START_ELEMENT、CHARACTERS、END_ELEMENT、END_DOCUMENT。实例化XmlPullParser解析器,设置输入编码(setInput),获得事件类型(getEventType),用SAX相同的处理进行,next()方法往下继续读取
DOCUMENT解析
1.实例化DocumentBuilderFactory
2.跟xml传入的数据结构进行处理
3.返回需要的列表值即可
三者区别
DOM:
解析器读入整个文档,然后构建一个驻留内存的树结构,然后代码就可以使用 DOM 接口来操作这个树结构。
优点:整个文档树在内存中,便于操作;支持删除、修改、重新排列等多种功能;
缺点:将整个文档调入内存(包括无用的节点),浪费时间和空间;
使用场合:一旦解析了文档还需多次访问这些数据;硬件资源充足(内存、CPU)
SAX/PULL:
事件驱动。当解析器发现元素开始、元素结束、文本、文档的开始或结束等时,发送事件,程序员编写响应这些事件的代码,保存数据。
优点:不用事先调入整个文档,占用资源少
缺点:不是持久的;事件过后,若没保存数据,那么数据就丢了;无状态性;从事件中只能得到文本,但不知该文本属于哪个元素;
使用场合:只需XML文档的少量内容,很少回头访问;一次性读取;机器内存少;
注意:SAX 解析器不创建任何对象。
1.继承DefaultHandler类,重写startDocument、startElement、character、endElement、endDocument方法,startDocument在读取
<?xml version="1.0" encoding="UTF-8"?>时调用,可写一些实例化列表等;startElement在读取每个标签时调用,通过判断历史标签需要是否为需要获取的值的头;characters用来读取标签中的值;endElement读取标签的结束,用来保存characters获取的值;endDocument一般不做处理。
2.用SAXParser或者XMLReader来解析
SAXParser解析:
SAXHandlerParseService saxForHandler = new SAXHandlerParseService(); SAXParserFactory spf = SAXParserFactory.newInstance(); SAXParser saxParse = spf.newSAXParser(); saxParse.parse(input, saxForHandler); List<Map<String, Object>> userList = saxForHandler.getUser();
XMLReader解析:
SAXHandlerParseService saxForHandler = new SAXHandlerParseService(); SAXParserFactory spf = SAXParserFactory.newInstance(); SAXParser saxParse = spf.newSAXParser(); // 为xmlReader设置内容处理器 XMLReader reader = saxParse.getXMLReader(); reader.setContentHandler(saxForHandler); // 开始赋值 reader.parse(new InputSource(new StringReader(xml))); List<Map<String, Object>> userList = saxForHandler.getUser();
在解析时,一定要小心,不要忽略空白的地方,Sax解析器会把它认为是一个TextNod
PULL解析
与SAX类似,同样有START_DOCUMENT、START_ELEMENT、CHARACTERS、END_ELEMENT、END_DOCUMENT。实例化XmlPullParser解析器,设置输入编码(setInput),获得事件类型(getEventType),用SAX相同的处理进行,next()方法往下继续读取
DOCUMENT解析
1.实例化DocumentBuilderFactory
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); DocumentBuilder builder = factory.newDocumentBuilder(); Document document = builder.parse(input); Element root = document.getDocumentElement();
2.跟xml传入的数据结构进行处理
3.返回需要的列表值即可
三者区别
DOM:
解析器读入整个文档,然后构建一个驻留内存的树结构,然后代码就可以使用 DOM 接口来操作这个树结构。
优点:整个文档树在内存中,便于操作;支持删除、修改、重新排列等多种功能;
缺点:将整个文档调入内存(包括无用的节点),浪费时间和空间;
使用场合:一旦解析了文档还需多次访问这些数据;硬件资源充足(内存、CPU)
SAX/PULL:
事件驱动。当解析器发现元素开始、元素结束、文本、文档的开始或结束等时,发送事件,程序员编写响应这些事件的代码,保存数据。
优点:不用事先调入整个文档,占用资源少
缺点:不是持久的;事件过后,若没保存数据,那么数据就丢了;无状态性;从事件中只能得到文本,但不知该文本属于哪个元素;
使用场合:只需XML文档的少量内容,很少回头访问;一次性读取;机器内存少;
注意:SAX 解析器不创建任何对象。
工程下载地址 (包括该文项目)
相关文章推荐
- java对世界各个时区(TimeZone)的通用转换处理方法(转载)
- java-注解annotation
- java-模拟tomcat服务器
- java-用HttpURLConnection发送Http请求.
- java-WEB中的监听器Lisener
- Android IPC进程间通讯机制
- Android Native 绘图方法
- Android java 与 javascript互访(相互调用)的方法例子
- 介绍一款信息管理系统的开源框架---jeecg
- 聚类算法之kmeans算法java版本
- java实现 PageRank算法
- PropertyChangeListener简单理解
- 插入排序
- 冒泡排序
- 堆排序
- 快速排序
- 二叉查找树