您的位置:首页 > 其它

PULL解析学习

2016-03-29 17:55 519 查看
学习过程

安卓中有三种对XML解析的方式,这个众所周知,DOM,SAX,PULL
其中被推荐的方法是PULL,说是非常简单,但从一开始接触就觉得比较迷惑,总是云里雾里的感觉,甚至在自己写出了一个能用的代码, 我也解释不了为什么能用,也害怕去改,虽然有过几次小小的突击学习理解,但是没有什么进展
直到这次我花了点心思和时间准备搞一搞,才有了通关性进展

在开始研究并查看一些资料的时候,当我看到一篇文章里边介绍了 5种解析事件的时候眼睛一亮,以为自己找到了理解的关键
但是在我继续往下理解的时候,发现那种生疏的感觉一点没少,感觉解析事件是关键,于是就继续找关于它的更多资料

但是找了半天发现关于PULL解析事件的资料很少,另一方面我又了解到PULL是SAX的接替者,原理是差不多的,于是我又去找了SAX的解析事件相关的东西,可惜还是很少,然后之后不小心又找到DOM去了,DOM的事件类型庞大无比,看了一会感觉没什么用,就放弃了

直到最后看到一篇不错的博文,然后又加上自己的分析,终于理解了问题的关键,就是:你得给我解释,那五种解析事件在一个XML文档中是在什么地方啊,你光说有五种事件怎么行。于是到最后我终于完全搞定了这块,并且重构了我的解析工具代码。

PULL解析理解

PULL是顺序扫描XML的每一行,并且根据扫描到的事件来做出不同的行为

PULL一共有5种事件类型:
* START_DOCUMENT:文档的开始,解析器尚未读取任何输入。
* START_TAG:开始标签的解析。
* TEXT:标签内元素的内容解析。
* END_TAG:结束标签的解析。
* END_DOCUMENT:文档的结束。

主要用的是4个,他们与XML文件相应内容是这么对应的(他们在XML文件中的位置是这样)





简单总结就是:

文档的开头和结束分别有文档开始和文档结束事件

文档中的每个节点,无论是根节点还是叶子节点,都在节点开始和节点结束的地方有事件

具体使用的建议:

文档开始和文档结束事件是有固定位置的,你只要在这个位置做你要做的事情就好了,比如初始化一些资源

节点开始和节点结束的事件在很多位置都可能发生,为了精确控制,你可以使用【获取他们的节点名称(name)进行判断】这一方法

三种解析方式对比

JAVA 解析 XML 通常有两种方式:DOM 和SAX(PULL)

DOM
DOM是结构化解析,会在内存中维护一个完整的XML的树状结构,开销大,对某些复杂需求可能比较方便

XML DOM 是 XML Document Object Model 的缩写,即 XML 文档对象模型。DOM(文档对象模型)是W3C标准,提供了标准的解析方式,但其解析效率一直不尽如人意,这是因为DOM解析XML文档时,把所有内容一次性的装载入内存,并构建一个驻留在内存中的树状结构(节点数)。如果需要解析的XML文档过大,或者我们只对该文档中的一部分感兴趣,这样就会引起性能问题。

它有一个非常庞大的事件库

SAX(PULL)
SAX和PULL的原理是一样的,都不维护什么完整的结构,而是逐行扫描,不保存结构关系,开销小,适合简单的需求

(两者区别是,SAX使用回调的方式实现,PULL使用switch case的方式实现)

SAX是事件驱动型XML解析的一个标准接口,SAX的工作原理简单地说就是对文档进行顺序扫描,当扫描到文档(document)开始与结束、元素(element)开始与结束、文档(document)结束等地方时通知事件处理函数,由事件处理函数做相应动作,然后继续同样的扫描,直至文档结束。

示例代码

上图中XML的解析方法:

public static List<EleTimeValue> parseToETVL(String xmlData) {

//在这新建变量,万一try没有的话,还能返回null
List<EleTimeValue> lists=null;
EleTimeValue eTV=null;
String value = "";
String time ="";
float valuef = 0;
Date timed = null;

SimpleDateFormat ft = new SimpleDateFormat ("yyyy-MM-dd HH:mm:ss");

try {

XmlPullParserFactory factory = XmlPullParserFactory.newInstance();
XmlPullParser xmlPullParser = factory.newPullParser();
xmlPullParser.setInput(new StringReader(xmlData));

int eventType = xmlPullParser.getEventType();

while (eventType != XmlPullParser.END_DOCUMENT) {

String nodeName = xmlPullParser.getName();

switch (eventType) {

//用eventType来控制什么时候开始解析某个结点
case XmlPullParser.START_DOCUMENT:
lists=new ArrayList<EleTimeValue>();
break;

//碰到STARTTAG之后开始一行行(eventtype可以当做行号)输入下面的ifelse语句中进行判断,不符合就跳出switch,并且在后边把行号加1,然后继续while循环
case XmlPullParser.START_TAG:

//增加一个错误检测,当解析内容时候发现errcode不为0的时候,直接结束解析,跳出swith,也跳出while,直接返回null
//这里传不出msg
if ("ErrCode".equals(nodeName) && !xmlPullParser.nextText().equals("0") ){
Log.d("t", "Null,要返回");
return null;
}else if("RegValue".equals(nodeName)) {
eTV = new EleTimeValue();
}else if("Value".equals(nodeName)) {
value = xmlPullParser.nextText();
valuef = Float.valueOf(value).floatValue()/10;
eTV.setValue(valuef);
}else if("DevTime".equals(nodeName)) {
time = xmlPullParser.nextText();
try {
timed = ft.parse(time);
} catch (ParseException e) {
System.out.println("Unparseable using " + ft);
}
eTV.setDate(timed);
}
break;

// 完成解析某个结点
case XmlPullParser.END_TAG:
if ("Reg".equals(nodeName)||"RegValue".equals(nodeName)) {
lists.add(eTV);
eTV = null;
}
break;

}
eventType = xmlPullParser.next();
}
} catch (Exception e) {
e.printStackTrace();
}

return lists;
}


参考文章:
http://baike.baidu.com/link?url=jyDUMCrvG56wJKcAxwDzBn6nuSy-m1yTxQCwNuT5N9Nu21crEkcibkg7DqOIZZGsDv4Mzi2gF48ak3EYAVVaMK
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: