您的位置:首页 > 移动开发 > Android开发

Android开发之XML解析——SAX解析XML

2013-04-21 15:12 330 查看
SAX的原理[此段内容转载http://hi.baidu.com/shdren09/item/24cd80f0e0926d08c7dc453b]

SAX的工作原理简单地说就是对文档进行顺序扫描,当扫描到文档(document)开始与结束、元素(element)开始与结束、文档(document)结束等地方时通知事件处理函数,由事件处理函数做相应动作,然后继续同样的扫描,直至文档结束。

大多数SAX实现都会产生以下类型的事件:

在文档内每一XML元素接受解析的前后触发元素事件。 

在文档的开始和结束时触发文档处理事件。 

在处理文档的DTD或Schema时产生DTD或Schema事件。 

任何元数据通常都由单独的事件交付。 

产生错误事件用来通知主机应用程序解析错误。 

对于如下文档:

<doc>

<para>Hello, world!</para>

<title>sax parse xml</title>

</doc>

在解析文档的过程中会产生如下一系列事件:

start document

start element: doc

start element: para

characters: Hello, world!

end element: para

stat element:title

characters:sax parse xml

end element:title

end element: doc

end document

一个完整的SAX处理过程涉及如下几个步骤:

(1)创建事件处理程序。 

(2)创建SAX解析器。

(4)对文档进行解析,将每个事件发送给处理程序。

(3)将事件处理程序分配给解析器。

只有将一个标签解析完了,才能添加到list;

SAX的优缺点 

SAX的优点: 

解析速度快 

ContentHandler对象可以是多个 

内存消耗少 

SAX的缺点: 

必须实现事件处理程序 

不能修改文档 

不能随机访问 

SAX解析器对文档的解析过程是一种边解析边执行的过程 

SAX解析器对文档的解析过程中,无需把整个文档都加载到内存中 

使用SAX解析器时,可以注册多个ContentHandler对象,并行接收事件 

SAX解析器对文档的解析是顺序进行的 

使用SAX对文档进行解析,只能访问文档内容,无法做到向文档中添加节点,更不能删除和修改文档中的内容。 

SAX的常用接口介绍 

ContentHandler接口 

ContentHandler是Java类包中一个特殊的SAX接口,位于org.xml.sax包中。该接口封装了一些对事件处理的方法,当XML解析器开始解析XML输入文档时,它会遇到某些特殊的事件,比如文档的开头和结束、元素开头和结束、以及元素中的字符数据等事件。当遇到这些事件时,XML解析器会调用ContentHandler接口中相应的方法来响应该事件。 

ContentHandler接口的方法有以下几种: 

void startDocument() 

void characters(char[ ] ch, int start, int length) 

void endDocument()

void startElement(String uri, String localName, String qName, Attributes atts) 

void endElement(String uri, String localName, String qName) 

DTDHandler接口 

DTDHandler用于接收基本的DTD相关事件的通知。该接口位于org.xml.sax包中。此接口仅包括DTD事件的注释和未解析的实体声明部分。SAX解析器可按任何顺序报告这些事件,而不管声明注释和未解析实体时所采用的顺序;但是,必须在文档处理程序的startDocument()事件之后,在第一个startElement()事件之前报告所有的DTD事件。 

DTDHandler接口包括以下两个方法: 

void startDocumevoid notationDecl(String name, String publicId, String systemId) nt() 

void unparsedEntityDecl(String name, String publicId, String systemId, String notationName) 

接收注释声明事件的通知

接收未解析的实体声明事件的通知 

EntityResolver接口 

EntityResolver接口是用于解析实体的基本接口,该接口位于org.xml.sax包中。 

该接口只有一个方法,如下: 

public InputSource resolveEntity(String publicId, String systemId) 

允许应用程序解析外部实体。并返回一个InputSource类的对象或者为null,用于读取实体信息 

解析器将在打开任何外部实体前调用此方法。此类实体包括在DTD内引用的外部DTD子集和外部参数实体和在文档元素内引用的外部通用实体等。如果SAX应用程序需要实现自定义处理外部实体,则必须实现此接口。 

ErrorHandler接口 

ErrorHandler接口是SAX错误处理程序的基本接口。如果SAX应用程序需要实现自定义的错误处理,则它必须实现此接口,然后解析器将通过此接口报告所有的错误和警告。 

该接口的方法如下: 

void error(SAXParseException exception) 

void fatalError(SAXParseException exception) 

接收可恢复的错误通知 

接收不可恢复的错误通知 

void warning(SAXParseException exception) 

接收警告的通知

下面是一个使用SAX解析XML的例子,SAX本身也是android自带的XML的解析的方式。

要解析的XML——student.xml:

<?xml version="1.0" encoding="UTF-8"?>

<root>

    <student id="1" group="1">

        <name>张三</name>

        <sex>男</sex>

        <age>18</age>

        <email>zhangsan@163.com</email>

        <birthday>1987-06-08</birthday>

        <memo>好学生</memo>

    </student>

    <student id="2" group="2">

        <name>李四</name>

        <sex>女</sex>

        <age>18</age>

        <email>lisi@163.com</email>

        <birthday>1987-06-08</birthday>

        <memo>好学生</memo>

    </student>

    <student id="3" group="3">

        <name>小王</name>

        <sex>男</sex>

        <age>18</age>

        <email>xiaowang@163.com</email>

        <birthday>1987-06-08</birthday>

        <memo>好学生</memo>

    </student>

    <student id="4" group="4">

        <name>小张</name>

        <sex>男</sex>

        <age>18</age>

        <email>xiaozhang@163.com</email>

        <birthday>1987-06-08</birthday>

        <memo>好学生</memo>

    </student>

    <student id="5" group="5">

        <name>小明</name>

        <sex>男</sex>

        <age>18</age>

        <email>xiaoming@163.com</email>

        <birthday>1987-06-08</birthday>

        <memo>好学生</memo>

    </student>

</root>

实现SAX解析的步骤:

1.创建事件处理程序;

2.创建SAX解析器;

3.将事件处理程序分配给解析器;

4.对文档进行解析,将事件发送给处理程序。

下面是我们的事件处理程序StudentParser.java:

import java.util.ArrayList;

import java.util.Calendar;

import java.util.List;

import org.xml.sax.Attributes;

import org.xml.sax.SAXException;

import org.xml.sax.helpers.DefaultHandler;

/**

 * SAX解析students.xml,生成Student对象,放入List中。

 * @author babylove

 *

 */

public class StudentParser extends DefaultHandler{
// 存放Student对象。
private List<Student> studentList = new ArrayList<Student>();
private Student student = null;
// 当前正在解析的节点
private String tagName;

// 返回解析结果给调用方。
public List<Student> getParseResult() {
return studentList;
}

@Override
public void endDocument() throws SAXException {
System.out.println("解析完毕。");
}

// 读到结束节点时调用
@Override
public void endElement(String uri, String localName, String qName)
throws SAXException {
// 当读到student的结束节点时,将Student添加到List
if (qName != null && qName.equals("student")) {
studentList.add(student);
}

tagName = null;
}

@Override
public void startDocument() throws SAXException {
// TODO Auto-generated method stub
super.startDocument();
}

// 解析标签之间的内容时调用。
@Override
public void characters(char[] ch, int start, int length)
throws SAXException {
if (tagName != null && tagName.length() > 0) {
// 标枪之间的文本内容
String data = new String(ch,start,length);
if (tagName.equals("name")) {
student.setName(data);
}
else if (tagName.equals("age")) {
student.setAge(Integer.valueOf(data));
}
else if (tagName.equals("sex")) {
student.setSex(data);
}
else if (tagName.equals("email")) {
student.setEmail(data);
}
else if (tagName.equals("memo")) {
student.setMemo(data);
}
else if (tagName.equals("birthday")) {
if (data != null && data.length() > 0) {
String[] dates = data.split("-");
Calendar c = Calendar.getInstance();
c.set(Calendar.YEAR, Integer.valueOf(dates[0]));
c.set(Calendar.MONTH, Integer.valueOf(dates[1]));
c.set(Calendar.DAY_OF_MONTH, Integer.valueOf(dates[2]));
student.setBirthday(c.getTime());
}
}
}
}

// 开始解析,开始读取节点时调用
// localName:节点名称,无前缀。
// qName:节点名称,有前缀,如果有。如sec:autherention
// Attributes:节点的属性集合。
@Override
public void startElement(String uri, String localName, String qName,
Attributes attributes) throws SAXException {
// 获取Student节点上的id和group属性
if (qName.equals("student")) {
student = new Student();
student.setId(Integer.valueOf(attributes.getValue(0)));
student.setGroup(Integer.valueOf(attributes.getValue(1)));
}

tagName = qName;
}

}

StudentActivity.java:

Activity很简单,就是一个按钮一个文本框。

单击按钮时开始解析,并将解析的结果显示到文本框。

import java.io.IOException;

import java.util.List;

import javax.xml.parsers.ParserConfigurationException;

import javax.xml.parsers.SAXParser;

import javax.xml.parsers.SAXParserFactory;

import org.xml.sax.SAXException;

import android.app.Activity;

import android.os.Bundle;

import android.util.Log;

import android.view.View;

import android.view.View.OnClickListener;

import android.widget.Button;

import android.widget.TextView;

import com.and.test.R;

public class SaxParserActivity extends Activity{
private Button startBtn = null;
private TextView tv = null;

@Override
protected void onCreate(Bundle savedInstanceState) {
// TODO Auto-generated method stub
super.onCreate(savedInstanceState);
setContentView(R.layout.saxxml);
startBtn = (Button) findViewById(R.id.saxxml_button);
tv = (TextView) findViewById(R.id.saxxml_textview);

startBtn.setOnClickListener(new OnClickListener() {
@Override
public void onClick(View v) {
SAXParserFactory saxParserFactory = SAXParserFactory.newInstance();
try {
SAXParser saxParser = saxParserFactory.newSAXParser();
StudentParser handler = new StudentParser();
saxParser.parse(StudentParser.class.getResourceAsStream("students.xml"), handler);
List<Student> studentList = handler.getParseResult();

StringBuilder sbr = new StringBuilder();

for (Student s : studentList) {
sbr.append(s.toString()).append("\n\n");
Log.d(SaxParserActivity.class.getName(), s.toString());
}
System.out.println(sbr);
tv.setText(sbr.toString());
} catch (ParserConfigurationException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (SAXException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
});
}

}

Student.java:

import java.util.Date;

public class Student {
private int id;
private int group;
public int getId() {
return id;
}
public void setId(int id) {
this.id = id;
}
public int getGroup() {
return group;
}
public void setGroup(int group) {
this.group = group;
}
private String name;
private String sex;
private int age;
private String email;
private Date birthday;
private String memo;
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public String getSex() {
return sex;
}
public void setSex(String sex) {
this.sex = sex;
}
public int getAge() {
return age;
}
public void setAge(int age) {
this.age = age;
}
public String getEmail() {
return email;
}
public void setEmail(String email) {
this.email = email;
}
public Date getBirthday() {
return birthday;
}
public void setBirthday(Date birthday) {
this.birthday = birthday;
}
public String getMemo() {
return memo;
}
public void setMemo(String memo) {
this.memo = memo;
}
@Override
public String toString() {
return "Student [id=" + id + ", group=" + group + ", name=" + name
+ ", sex=" + sex + ", age=" + age + ", email=" + email
+ ", birthday=" + birthday + ", memo=" + memo + "]";
}

}

布局文件saxxml.xml:

<?xml version="1.0" encoding="utf-8"?>

<LinearLayout

  xmlns:android="http://schemas.android.com/apk/res/android"

  android:orientation="vertical"

  android:layout_width="match_parent"

  android:layout_height="match_parent">

  <Button android:id="@+id/saxxml_button"

  android:layout_width="fill_parent"

  android:layout_height="wrap_content"

    android:text="@string/start"

  />

    <TextView android:id="@+id/saxxml_textview"

    android:layout_width="fill_parent"

    android:layout_height="wrap_content"

    />

</LinearLayout>

解析结果:

04-21 14:58:58.570: INFO/System.out(14853): Student [id=1, group=1, name=张三, sex=男, age=18, email=zhangsan@163.com, birthday=Wed Jul 08 15:58:58
格林尼治标准时间+0800 1987, memo=好学生]

04-21 14:58:58.570: INFO/System.out(14853): Student [id=2, group=2, name=李四, sex=女, age=18, email=lisi@163.com, birthday=Wed Jul 08 15:58:58 格林尼治标准时间+0800 1987, memo=好学生]

04-21 14:58:58.570: INFO/System.out(14853): Student [id=3, group=3, name=小王, sex=男, age=18, email=xiaowang@163.com, birthday=Wed Jul 08 15:58:58 格林尼治标准时间+0800 1987, memo=好学生]

04-21 14:58:58.574: INFO/System.out(14853): Student [id=4, group=4, name=小张, sex=男, age=18, email=xiaozhang@163.com, birthday=Wed Jul 08 15:58:58 格林尼治标准时间+0800 1987, memo=好学生]

04-21 14:58:58.574: INFO/System.out(14853): Student [id=5, group=5, name=小明, sex=男, age=18, email=xiaoming@163.com, birthday=Wed Jul 08 15:58:58 格林尼治标准时间+0800 1987, memo=好学生]

SAX解析实际上并不难理解,SAX基于事件驱动,在解析开始节点,文本,结束节点都会有相应的事件,在这些事件中得到需要的数据。

DOM解析是一次性在内存装载文档,根据标签解析,比较适合文档较小的情况。

SAX解析是按顺序一个节点一个节点解析,比较适合文档较大的情况。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: