您的位置:首页 > 其它

两种解析XML文档的方法---DOM和SAX

2011-11-07 20:08 656 查看
两种解析XML文档的方法---DOM和SAX
DOM方式解析XML文件
DOC解析编程:
查找某一个节点
// 查找固定值的书的元素的第二个子节点
public static void findFixedChildren(Document doc) {
//通过名字查找并返回一个集合
NodeList list = doc.getElementsByTagName("书名");
for (int i = 0; i < list.getLength(); i++) {
//通过Item()方法返回集合中的第i项
Node n = list.item(i);
System.out.println(n.getNodeName());
}
//查找书架中的子元素的第二个元素
int index = 2;
//获取集合中的长度并判断,如果长度》2,说明有要找的那个元素,然后找出并输出
if (list.getLength() >= 2) {
Node bookname = list.item(index);
System.out.println(bookname.getNodeName() +bookname.getNodeType()+ bookname.getNodeValue());
}
删除结点
// 删除节点
public static void deleteElement(Document doc)
throws Exception {
// 获取要删除的那个节点对象
Node node = doc.getElementsByTagName("售价").item(1);
//getParentNode()是此节点的父节点
//removeChild() 从子节点列表中移除 oldChild 所指示的子节点,并将其返回。
node.getParentNode().removeChild(node);// removeChild

// 将内存中树状结构doc'写入到xml文档中
TransformerFactory factory = TransformerFactory.newInstance();
// 由工厂对象生成装换对象Transformer
Transformer trans = factory.newTransformer();
// 通过trans实现doc转换到xml文档,用的此方法中的参数是(Source,Result),必须用此方法的实现了改接口的类才可以用,DOMSource实现了Suorce
// 需要一个DOMSource对象来代表源树
trans.transform(new DOMSource(doc),
new
StreamResult(new File(
"src/Book.xml")));
}
注意:将内存中树状结构doc'写入到xml文档中,在其中,当调用transform方法时,有两个参数,分别为 Source和Resutl,但这两个数是接口,但必须在用的时候,要用实现了该接口的类才可以,所以用到了DOMSource 和StreamResult两个方法
TransformerFactory factory = TransformerFactory.newInstance()
Transformer trans = factory.newTransformer();
trans.transform(new DOMSource(doc),
new StreamResult(new File(
"src/Book.xml")));

添加节点
// 节点的添加
public static void createElement(Document doc)
throws Exception {
// 确定添加节点 的位置,得到的是集合是父节点,通过标签名找,返回的是集合,要确定是哪个节点
Node book = doc.getElementsByTagName("书").item(0);
// 生成一个新节点
Element element = doc.createElement("出版社");
// element.setTextContent("清华大学");
Text text = doc.createTextNode("清华大学出版社");
element.appendChild(text);
// 在指定 的位置把新生成的节点添加进去
book.appendChild(element);

// 将内存中树状结构doc'写入到xml文档中
TransformerFactory factory = TransformerFactory.newInstance();
// 由工厂对象生成装换对象Transformer
Transformer trans = factory.newTransformer();
// 通过trans实现doc转换到xml文档,用的此方法中的参数是(Source,Result),必须用此方法的实现了改接口的类才可以用,DOMSource实现了Suorce
// 需要一个DOMSource对象来代表源树
trans.transform(new DOMSource(doc),
new
StreamResult(new File(
"src/Book.xml")));
}
插入节点
public static void createFileElement(Document doc)
throws Exception {
// 确定插入点的位置
Node author = doc.getElementsByTagName("作者").item(0);
Node parent = author.getParentNode();// 指定插入到作者之前

//插入到author的后面
Node brothder = author.getNextSibling();
// 创建新节点
Element element = doc.createElement("出版社");
element.setTextContent("清华大学出版社");

// 插入节点,在书这个节点中在作者前插入
// parent.insertBefore(element, author);//()
parent.insertBefore(element, brothder);
// 将内存中树状结构doc'写入到xml文档中
TransformerFactory factory = TransformerFactory.newInstance();
// 由工厂对象生成装换对象Transformer
Transformer trans = factory.newTransformer();
// 通过trans实现doc转换到xml文档,用的此方法中的参数是(Source,Result),必须用此方法的实现了改接口的类才可以用,DOMSource实现了Suorce
// 需要一个DOMSource对象来代表源树
trans.transform(new DOMSource(doc),
new
StreamResult(new File(
"src/Book.xml")));
}
修改节点
public static void updateElement(Document doc)
throws
Exception {
// 获取要更新的对象
Node node = doc.getElementsByTagName("售价").item(0);
node.setTextContent("500");
// 修改属性
if (node instanceof Element) {
Element element = (Element) node;
Attr att = element.getAttributeNode("type");
att.setValue("美元");
}

// 将内存中树状结构doc'写入到xml文档中
TransformerFactory factory = TransformerFactory.newInstance();
// 由工厂对象生成装换对象Transformer
Transformer trans = factory.newTransformer();
// 通过trans实现doc转换到xml文档,用的此方法中的参数是(Source,Result),必须用此方法的实现了改接口的类才可以用,DOMSource实现了Suorce
// 需要一个DOMSource对象来代表源树
trans.transform(new DOMSource(doc),
new
StreamResult(new File(
"src/Book.xml")));
}
Node方法的总结:
(1)node.getNodeType() 得到的是节点的类型 元素节点类型是1 文本节点为 3
(2)node.getNodeValue() 元素的值为空 因为节点是Element,所有返回的是null
(3)得到元素中的内容的方法:
node.getTextContent()
Text text = (Text)node.getChildNoddes().item(0) Text.getNodeValues()

SAM解析xml文档
(1)SAM解析的优点:
SAX解析允许在读取文档的时候,即对文档进行处理,而不必等到整个文档装载完才会文档进行操作。
(2)SAM解析的分析:
SAX采用事件处理的方式解析XML文件,利用 SAX 解析 XML 文档,涉及两个部分:解析器和事件处理器:
• 解析器可以使用JAXP的API创建,创建出SAX解析器后,就可以指定解析器去解析某个XML文档。
• 解析器采用SAX方式在解析某个XML文档时,它只要解析到XML文档的一个组成部分,都会去调用事件处理器的一个方法,解析器在调用事件处理器的方法时,会把当前解析到的xml文件内容作为方法的参数传递给事件处理器。
• 事件处理器由程序员编写,程序员通过事件处理器中方法的参数,就可以很轻松地得到sax解析器解析到的数据,从而可以决定如何对数据进行处理。
(3)SAM解析的步骤:
//获取SAX解析器工厂类的对象
SAXParserFactory factory = SAXParserFactory.newInstance();
//获取Sax解析器
SAXParser sax = factory.newSAXParser();
//通过解析器解析xml文档
//BookHandler事件处理器
sax.parse(new File("src/Book.xml"),new BookHandler());

BookHandler是事件处理器,要想调用必须要重写DefaultHandler中的方法来实现功能,
class BookHandler extends DefaultHandler{
private boolean flag = false;
@Override
//标签体的内容的解析的方法
public void characters(char[] ch,
int start, int length) throws SAXException {
// TODO Auto-generated method stub
super.characters(ch, start, length);
if(flag = true){
System.out.println("元素的内容为:"+new String(ch,start,length));
}
//flag = false;
}

@Override
//文档结束时调用的方法
public void endDocument() throws SAXException {
// TODO Auto-generated method stub
super.endDocument();
System.out.println("xml文档的结束");
}

@Override
//结束时调用的元素
public void endElement(String uri, String locaName, String qName)
throws SAXException {
// TODO Auto-generated method stub
super.endElement(uri, locaName, qName);
//System.out.println("元素的结束:"+qName);
if(qName.equals("书")){
flag = false;
}
}

@Override
public void startDocument() throws SAXException {
// TODO Auto-generated method stub
super.startDocument();
System.out.println("xml文档的开始");
}

@Override
public void startElement(String uri, String locaName, String qName,
Attributes attributes) throws SAXException {
// TODO Auto-generated method stub
super.startElement(uri, locaName, qName, attributes);
// System.out.println("元素的开启:"+qName);
if(qName.equals("书")){
System.out.println("元素的开启:"+qName);
flag = true;
}
}
}
·
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: