您的位置:首页 > 编程语言 > Java开发

Java SAX 解析 XML

2016-12-26 23:16 417 查看
与 DOM 建立树形结构的方式不同,SAX 采用事件模型来解析 XML 文档,是解析 XML 文档的一种更快速、更轻量的方法。

利用 SAX 可以对 XML 文档进行有选择的解析和访问,而不必像 DOM 那样加载整个文档,因此它对内存的要求较低。

但 SAX 对 XML 文档的解析为一次性读取,不创建任何文档对象,很难同时访问文档中的多处数据。

在解析xml文件之前,我们要先了解xml文件的节点的种类,一种是ElementNode,一种是TextNode

如下面代码片段

<root>
<person>
<username>张三</username>
<age>22</age>
<idcard>320105197903082216</idcard>
</person>
</root>


其中
<root>、<person>
属于ElementNode,张三、22属于TextNode

然后还要知道SAX解析XML的执行顺序,看下面这张图



xml文件被Sax解析器载入,由于Sax解析是按照xml文件的顺序来解析,首先会调用startDocument()方法

当读入的时候,由于它是ElementNode,所以会调用startElement(String uri, String localName, String qName,

Attributes attributes)方法,其中第三个参数是节点的名称,

图中3的位置会调用characters(char[] ch, int start, int length)方法虽然是空白,Sax解析器也会把它认为是一个TextNode,

由于空白不是我们想要的数据,我们需要的是节点下的文本信息,所以这就要定义一个标识来记录上一节点的名称

在characters()方法中,判断当前节点是不是username,如果是,就取出里面的文本信息

简单概括一下执行顺序

1、startDocument

2、startElement
<root>


3、characters
空白


4、startElement
<person>


5、characters
空白


6、startElement
<username>


7、characters
张三


8、endElement
</username>


首先定义Person类,封装Person对象

public class Person {
private String username;
private String age;
private String idcard;

public String getUsername() {
return username;
}

public void setUsername(String username) {
this.username = username;
}

public String getAge() {
return age;
}

public void setAge(String age) {
this.age = age;
}

public String getIdcard() {
return idcard;
}

public void setIdcard(String idcard) {
this.idcard = idcard;
}

public String toString() {
StringBuffer buf = new StringBuffer();
buf.append("username: " + username);
buf.append(", age: " + age);
buf.append(", idcard: " + idcard);
return buf.toString();
}
}


SAX解析代码如下:

import java.io.File;
import java.util.ArrayList;
import java.util.List;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
import com.home.bean.Person;

public class SaxParseService extends DefaultHandler {
private List<Person> persons = null; // 保存Person
private Person person = null;
private String preTag = null;// 作用是记录解析时的上一个节点名称

public List<Person> getPersons(File file) throws Exception {
SAXParserFactory factory = SAXParserFactory.newInstance();
SAXParser parser = factory.newSAXParser();
SaxParseService handler = new SaxParseService();
parser.parse(file, handler);
return handler.getPersons();
}

public List<Person> getPersons() {
return persons;
}

@Override
public void startDocument() throws SAXException {
persons = new ArrayList<Person>();
}

@Override
public void startElement(String uri, String localName, String qName,
Attributes attributes) throws SAXException {
if ("person".equals(qName)) {
person = new Person(); // 如果节点为<person> 就实例化一个对象
}
preTag = qName;// 将正在解析的节点名称赋给preTag
}

@Override
public void endElement(String uri, String localName, String qName)
throws SAXException {
if ("person".equals(qName)) {
persons.add(person);
person = null;
}
preTag = null; // 当解析结束时设置为空,以便执行characters()方法时进行匹配
}

@Override
public void characters(char[] ch, int start, int length)
throws SAXException {
if (preTag != null) {
String content = new String(ch, start, length);
if ("username".equals(preTag)) {
person.setUsername(content);
} else if ("age".equals(preTag)) {
person.setAge(content);
} else if ("idcard".equals(preTag)) {
person.setIdcard(content);
}
}
}

public static void main(String[] args) {
SaxParseService sax = new SaxParseService();
File file = new File("person.xml");
try {
List<Person> persons = sax.getPersons(file);
for (Person person : persons) {
System.out.println(person.toString());
}
} catch (Exception e) {
e.printStackTrace();
}
}
}


作者:itmyhome
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: