您的位置：首页 > 移动开发 > Android开发

android XML解析学习——Dom方式

2010-11-29 22:16 627 查看

一．基础知识
　　在《OPhone XML解析学习--Sax方式》和《OPhone XML解析学习--Sax方式(续)》中我们学习了在OPhone/Android平台上使用SAX的方式解析XML文档的方法。除了SAX的方式，还有一种常用的为DOM（Document Object Model文档对象模型）方式。
　　DOM方式解析XML的过程为首先将所有 XML 文档读取到内存中，构造一个树结构，然后允许使用 DOM API 来操作整个树结构，包括遍历 XML 树、检索所需的数据等。
　　OPhone/Android平台使用Java SDK中的API来实现DOM方式的解析，具体的方法和之前学习的使用Java SDK中的SAX方式解析XML类似，因此有了前面SAX的基础，学习DOM方式就会比较简单了。DOM 和之前的SAX 的主要差别是 API 本身的结构，SAX 由基于事件的回调集组成，边解析边产生事件从而调用事件处理器的回调函数进行处理。而DOM不是，DOM直接读取整个XML树保存为Document类，因此只需处理保存在内存中的Document对象即可，没有回调函数。
　　DOM解析相关的包为javax.xml.parsers和org.w3c.dom。其中javax.xml.parsers提供Document构造器工厂DocumentBuilderFactory和Document构造器DocumentBuilder，DocumentBuilderFactory实例调用newDocumentBuilder()创建构造器DocumentBuilder实例，然后该实例就可以调用parse方法来返回一个解析为Document类的实例。Document 类由表示XML文档的包含元素、属性、文本内容等的各个节点组成。因此有了Document对象后就可以按需要获取xml文档中各个子节点及其相关的值了。Document、Element、Node等各个和DOM相关的具体部分都在org.w3c.dom包中，因此和SAX类似，org.w3c.dom包是底层具体的负责DOM解析相关的内容，并且为上层javax.xml.parsers包提供DOM解析器等相关调用。

　　下面我们就用上面介绍的DOM方式来实现解析XML形式的USGS地震数据的Demo例子。

　　二．实例开发
　　我们要完成的效果图如下图1所示：

　　图1 ListView列表显示的地震数据

　　和上一部分Demo例子的一样，也是解析完地震数据后用ListView列表的方式显示每条地震的震级和地名信息。
　　新建一个OPhone工程OPhoneXMLDemoDom。
　　要添加的基本内容和上一个Demo中的一样，这里就不再赘述，这次要添加的解析器新类为DomEarthquakeHandler，内容如下所示：

view plain copy to clipboard print ?

public class DomEarthquakeHandler {

　　 //xml解析用到的Tag

　　 private String kEntryElementName = "entry";

　　 private String kLinkElementName = "link";

　　 private String kLinkAttributeName = "href";

　　 private String kTitleElementName = "title";

　　 private String kUpdatedElementName = "updated";

　　 private String kGeoRSSPointElementName = "georss:point";

　　 private String kGeoRSSElevElementName = "georss:elev";

　　 //用于保存xml解析获取的结果

　　 private ArrayList<EarthquakeEntry> earthquakeEntryList;

　　 private EarthquakeEntry earthquakeEntry = null;

　　 //解析xml数据

　　 public ArrayList<EarthquakeEntry> parse(InputStream inStream)

　　 {

　　 earthquakeEntryList = new ArrayList<EarthquakeEntry>();

　　 //创建DocumentBuilder

　　 DocumentBuilderFactory docBFactory = DocumentBuilderFactory.newInstance();

　　 DocumentBuilder docBuilder = null;

　　 try {

　　 docBuilder = docBFactory.newDocumentBuilder();

　　 } catch (ParserConfigurationException e1) {

　　 // TODO Auto-generated catch block

　　 e1.printStackTrace();

　　 }

　　 //解析地震数据流.

　　 Document doc = null;

　　 try {

　　 doc = docBuilder.parse(inStream);

　　 } catch (SAXException e1) {

　　 // TODO Auto-generated catch block

　　 e1.printStackTrace();

　　 } catch (IOException e1) {

　　 // TODO Auto-generated catch block

　　 e1.printStackTrace();

　　 }

　　 Element docEle = doc.getDocumentElement();

　　

　　 // Get a list of each earthquake entry.

　　 NodeList nList = docEle.getElementsByTagName(kEntryElementName);

　　 if(nList != null && nList.getLength() > 0)

　　 {

　　 for(int i=0; i < nList.getLength(); i++)

　　 {

　　 try {

　　 Element entry = (Element)nList.item(i);

　　 Element title = (Element)entry.getElementsByTagName(kTitleElementName).item(0);

　　 Element when = (Element)entry.getElementsByTagName(kUpdatedElementName).item(0);

　　 Element gpoint = (Element)entry.getElementsByTagName(kGeoRSSPointElementName).item(0);

　　 Element gelev = (Element)entry.getElementsByTagName(kGeoRSSElevElementName).item(0);

　　 Element link = (Element)entry.getElementsByTagName(kLinkElementName).item(0);

　　

　　 String details = title.getFirstChild().getNodeValue();

　　 String point = gpoint.getFirstChild().getNodeValue();

　　 String elevS = gelev.getFirstChild().getNodeValue();

　　 String date = when.getFirstChild().getNodeValue();

　　 //获取link链接

　　 String webLink = link.getAttribute(kLinkAttributeName);

　　 // Log.v("Dom", webLink);

　　 //构造更新时间

　　 SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd'T'hh:mm:ss'Z'");

　　 Date qdate = new GregorianCalendar(0,0,0).getTime();

　　 try {

　　 qdate = sdf.parse(date);

　　 } catch (ParseException e) {

　　 e.printStackTrace();

　　 }

　　 //提取经纬度信息

　　 String[] latLongitude = point.split(" ");

　　 Location location = new Location("dummyGPS");

　　 location.setLatitude(Double.parseDouble(latLongitude[0]));

　　 location.setLongitude(Double.parseDouble(latLongitude[1]));

　　 //提取强度信息

　　 String magnitudeString = details.split(" ")[1];

　　 int end = magnitudeString.length()-1;

　　 double magnitude = Double.parseDouble(magnitudeString.substring(0, end));

　　 //提取位置信息

　　 String place = details.split(",")[1].trim();

　　 //提取海拔高度信息

　　 double evel;

　　 //因为USGS数据有可能会输错，比如为"--10000"，多了一个"-"号

　　 try {

　　 evel = Double.parseDouble(elevS);

　　 } catch (Exception e) {

　　 // TODO: handle exception

　　 e.printStackTrace();

　　 evel = 0;

　　 }

　　 Log.v("Dom_Elev", String.valueOf(evel));

　　 earthquakeEntry = new EarthquakeEntry(qdate, place, webLink, location, magnitude, evel);

　　

　　 earthquakeEntryList.add(earthquakeEntry);

　　 } catch (Exception e) {

　　 // TODO: handle exception

　　 e.printStackTrace();

　　 }

　　 }

　　 }

　　 Log.v("Dom", "End");

　　 return earthquakeEntryList;

　　 }

　　}

　　程序首先也是定义解析时需要用到的元素Tag名称变量，其中因为DOM没有像SAX方式那样可以把一个元素的的名称分开为表示名称空间的Uri和当前标签名的localname，只是通过getElementsByTagName方法由完整的名称读取，因此需要定义完整的元素标签名称：

view plain copy to clipboard print ?

private String kGeoRSSPointElementName = "georss:point";

　 private String kGeoRSSElevElementName = "georss:elev";

　　在定义的用于解析xml数据的方法中

view plain copy to clipboard print ?

public ArrayList<EarthquakeEntry> parse(InputStream inStream)

　　
　　使用工厂类创建Document构造器DocumentBuilder:

view plain copy to clipboard print ?

//创建DocumentBuilder

　 DocumentBuilderFactory docBFactory = DocumentBuilderFactory.newInstance();

　 DocumentBuilder docBuilder = null;

　 try {

　 docBuilder = docBFactory.newDocumentBuilder();

　 } catch (ParserConfigurationException e1) {

　 // TODO Auto-generated catch block

　 e1.printStackTrace();

　 }

　　然后调用DocumentBuilder实例的parse方法解析xml文档数据并返回Document对象，并通过getDocumentElement()方法获取文档的根元素。

view plain copy to clipboard print ?

//解析地震数据流.

Document doc = null;

try {

doc = docBuilder.parse(inStream);

} catch (SAXException e1) {

// TODO Auto-generated catch block

e1.printStackTrace();

} catch (IOException e1) {

// TODO Auto-generated catch block

e1.printStackTrace();

}

Element docEle = doc.getDocumentElement();

　　有了XML文档的根元素，就可以通过getElementsByTagName等方法获取具体的子元素，及子节点和节点值等。具体方法可以参考以上的代码。
　　最后添加OPhoneXMLDemoDom.java文件中的内容，内容和前一个Demo工程OPhoneXMLDemoSaxII中的OPhoneXMLDemoSaxII.java基本一样，

view plain copy to clipboard print ?

public class OPhoneXMLDemoDom extends Activity {

　　/** Called when the activity is first created. */

　　 //定义显示的List相关变量

　　 ListView list;

　　 ArrayAdapter<EarthquakeEntry> adapter;

　　 ArrayList<EarthquakeEntry> earthquakeEntryList;

　　@Override

　　public void onCreate(Bundle savedInstanceState) {

　　super.onCreate(savedInstanceState);

　　setContentView(R.layout.main);

　　//获取地震数据流

　　InputStream earthquakeStream = readEarthquakeDataFromFile();

　　//Dom方式进行xml解析

　　DomEarthquakeHandler domHandler = new DomEarthquakeHandler();

　　earthquakeEntryList = domHandler.parse(earthquakeStream);

　　 //用ListView进行显示

　　 list = (ListView)this.findViewById(R.id.list);

　　 adapter = new ArrayAdapter<EarthquakeEntry>(this, android.R.layout.simple_list_item_1, earthquakeEntryList);

　　 list.setAdapter(adapter);

　　}

　　private InputStream readEarthquakeDataFromFile()

　　{

　　 //从本地获取地震数据

　　 InputStream inStream = null;

　　 try {

　　 inStream = this.getAssets().open("USGS_Earthquake_1M2_5.xml");

　　 } catch (IOException e) {

　　 // TODO Auto-generated catch block

　　 e.printStackTrace();

　　 }

　　 return inStream;

　　}

　　private InputStream readEarthquakeDataFromInternet()

　　{

　　 //从网络上获取实时地震数据

　　 URL infoUrl = null;

　　 InputStream inStream = null;

　　 try {

　　 infoUrl = new URL("http://earthquake.usgs.gov/earthquakes/catalogs/1day-M2.5.xml");

　　 URLConnection connection = infoUrl.openConnection();

　　 HttpURLConnection httpConnection = (HttpURLConnection)connection;

　　 int responseCode = httpConnection.getResponseCode();

　　 if(responseCode == HttpURLConnection.HTTP_OK)

　　 {

　　 inStream = httpConnection.getInputStream();

　　 }

　　 } catch (MalformedURLException e) {

　　 // TODO Auto-generated catch block

　　 e.printStackTrace();

　　 } catch (IOException e) {

　　 // TODO Auto-generated catch block

　　 e.printStackTrace();

　　 }

　　 return inStream;

　　}

　　}

　　只是把进行XML解析的部分换成了如下方式：

　　//Dom方式进行xml解析

　　DomEarthquakeHandler domHandler = new DomEarthquakeHandler();

　　earthquakeEntryList = domHandler.parse(earthquakeStream);

　　完成了，可以保存运行看下效果。

　　这样我们就已经学习了OPhone/Android上使用SAX和DOM两种方式解析XML的方法，下面我们简单总结比较一下两者的区别。
　　DOM解析器是通过将XML文档解析成树状模型并将其放入内存来完成解析工作的，而后对文档的操作都是在这个树状模型上完成的。这个在内存中的文档树将是文档实际大小的几倍。这样做的好处是结构清除、操作方便，而带来的麻烦就是极其耗费系统资源。而SAX正好克服了DOM的缺点。SAX解析器的处理过程是通读整个文档，根据文档内容产生事件，而把对这些事件的处理交由事件处理器处理。SAX不需要在内存中保存整个文档，它对系统资源的节省是显而易见的。这样在一些需要处理大型XML文档和性能要求比较高的场合就要用SAX了。
　　我们以表格的形式看一下他们在一些方面的比较：

SAX	DOM
顺序读入文档并产生相应事件，可以处理任何大小的XML文档	在内存中创建文档树，不适于处理大型XML文档
只能对文档按顺序解析一遍，不支持对文档的随意访问	可以随意访问文档树的任何部分，没有次数限制
只能读取XML文档内容，而不能修改	可以随意修改文档树，从而修改XML文档
开发上比较复杂，需要自己来实现事件处理器	易于理解，易于开发

　　通过比较我们可以知道SAX和DOM各自适合的场合：
　　SAX适于处理下面的问题：
　　1. 对大型文档进行处理
　　2. 只需要文档的部分内容，或者只需要从文档中得到特定信息
　　DOM适合处理下面的问题：
　　1. 需要对文档进行修改
　　2. 需要随机对文档进行访问
　　以上只是对SAX和DOM方式传统的比较，而对具体的在OPhone/Android平台上使用来说，因为DOM更加占用内存，而对运行在移动设备上的OPhone/Android系统来说往往内存是一个比较稀缺的资源，因此除非XML 文档始终保持很小的大小，否则相对来说推荐在OPhone/Android 应用程序中使用SAX 方式解析XML 。并且OPhone/Android系统为SAX还提供了额外的实用工具android.util.Xml和特有的包android.sax等，因此实际上在OPhone/Android使用SAX也一样很方便了。

　　三．总结
　　在这部分中我们学习了使用DOM方式解析XML的方法，并且比较了DOM方式和SAX方式的各种特点及区别。
　　从以上的学习我们知道OPhone/Android平台已经为XML的解析提供了强大的功能，既可以使用Java SDK中的SAX和DOM方式来解析，还可以使用OPhone/Android SDK提供的SAX方式。但OPhone/Android平台上还有一种解析XML的方式，就是使用Pull解析器，这部分内容我们以后接着学习。

　　注：
　　参考资料：http://www.ibm.com/developerworks/cn/xml/x-jaxp/

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航