您的位置：首页 > 编程语言 > Java开发

JavaWeb基础知识day06——XML&XML解析

2019-02-25 22:00 127 查看

什么是XML?

XML是指可扩展标记语言(eXtensible Markup Language)，
它是一种标记语言，很类似HTML。它被设计的宗旨描述数据【一般用作：配置文件】，而非显示数据。

应用：在Java开发中，传统的配置文件是*.properties属性文件(key=value)，
而XML表示的数据更为丰富。XML技术除用于描述有关系的数据外，还经常用作软件配置文件，以描述程序模块之间的关系。(如的Struts、Spring和Hibernate等框架都是基于XML作为配置文件的)在一个软件系统中，通过XML配置文件可以提高系统的灵活性。即程序的行为是通过XML文件来配置的，而不是硬编码。

XML文档的组成

一个XML文件一般由以下几部分组成：文档声明、元素、元素的属性、注释、CDATA区、特殊字符。

文档声明

在编写XML文档时，需要先使用文档声明来声明XML文档。且必须出现在文档的第一行第一列。

<?xml version="1.0" encoding="UTF-8"?>

要求:
必须在xml文件的第一行
必须顶格写

元素

元素(标签)的名称可以包含字母、数字、减号、下划线和英文句点，但必须遵守下面的一些规范：
       1.严格区分大小写；<p><P>
       2.只能以字母或下划线开头；abc _abc
       3.不能以xml(或XML、Xml、xMl、XML等)开头----W3C保留日后使用；
       4.名称字符之间不能有空格或制表符；
       5.名称字符之间不能使用冒号； (有特殊用途)
       6.XML元素指XML文件中出现的标签。一个标签分为开始和结束标签(不能省略)。
一个标签有如下几种书写形式：
   包含标签体：<age>18</age>         <Student><name></name><age>18</age></Student>
   不含标签体：<Student name="zhangsan" age="18"/>
   一个标签中可以嵌套若干子标签，但所有标签必须合理的嵌套，不允许有交叉嵌套。
       <mytag1><mytag2></mytag1> </mytag2>WRONG
       <mytag1><mytag2></mytag2></mytag1> RIGHT
一个XML文档必须有且仅有一个根标签，其他标签都是这个根标签的子标签或孙标签。

元素的属性

一个元素可以有多个属性，每个属性都有它自己的名称和取值。
属性值一定要用引号(单引号或双引号)引起来。
属性名称的命名规范与元素的命名规范相同、元素中的属性是不允许重复的。

注释

XML中的注释语法为：注意：
XML声明之前不能有注释
注释不能嵌套

CDATA区

CDATA是Character Data的缩写
作用：把标签当做普通文本内容；
语法：<![CDATA[内容]]>
   举例：
   <![CDATA[
       <itheima>www.itheima.com</itheima>
   ]]>       被当做普通文本而不是标签

特殊字符

特殊字符替代符号
& &
< <
> >
" "
' '

xml约束:

作用:规定xml中可以出现那些元素及那些属性,以及他们出现的顺序.
   约束的分类:
       DTD约束:struts hiebernate等等
       SCHEMA约束:tomcat spring等等

DTD约束:

和xml的关联   (一般都会提供好,复制过来即可,有时候连复制都不需要.)
       方式1:内部关联
           格式:
               <!DOCTYPE 根元素名 [dtd语法]>
       方式2:外部关联-系统关联
           格式:
               <!DOCTYPE 根元素名 SYSTEM "约束文件的位置">
           例如:
               <!DOCTYPE web-app SYSTEM "web-app_2_3.dtd">
       方式3:外部关联-公共关联
           格式:
               <!DOCTYPE 根元素名 PUBLIC "约束文件的名称" "约束文件的位置">

dtd语法(了解)
   元素:
       <!Element 元素名称数据类型|包含内容>
           数据类型:
               #PCDATA:普通文本使用的时候一般用()引起来
           包含内容:
               该元素下可以出现那些元素用()引起来
       符号:
           *   出现任意次
           ?   出现1次或者0次
           +   出现至少1次
           |   或者
           () 分组
           ,   顺序
   属性:
       格式:
           <!ATTLIST 元素名属性名属性类型属性是否必须出现>
       属性类型:
           ID:唯一
           CDATA:普通文本
       属性是否必须出现
           REQUIRED:必须出现
           IMPLIED:可以不出现

   一个xml文档中只能添加一个DTD约束

SCHEMA约束:

一个xml文档中可以添加多个schema约束
   xml和schema的关联.
       格式:
           <根标签 xmlns="..." ...>
           <根标签 xmlns:别名="..." ...>
   名称空间:
       关联约束文件
       规定元素是来源于那个约束文件的
   例如:
       一个约束文件中规定 table(表格) 表格有属性 row和col
       还有一个约束文件规定 table(桌子) 桌子有属性 width和height

       在同一个xml中万一我把两个约束文件都导入了,
           在xml中我写一个table,这个table有什么属性????
       我们为了避免这种情况的发生,可以给其中的一个约束起个别名
       使用的时候若是没有加别名那就代表是来自于没有别名的约束文件
           例如 table(表格) 给他起个别名 xmlns:a="..."
           在案例中使用 a:table 代表的是表格
           若在案例中直接使用 table 代表的是桌子
       在一个xml文件中只能有一个不起别名;
注意:
   schema约束本身也是xml文件.

xml解析:

解析方式:
       1.sax:特点:逐行解析,只能查询.
       2.dom:特点:一次性将文档加载到内容中,形成一个dom树.可以对dom树curd操作
   解析技术:
       JAXP：sun公司提供支持DOM和SAX开发包
       JDom：dom4j兄弟
       jsoup：一种处理HTML特定解析开发包
       ★dom4j：比较常用的解析开发包，hibernate底层采用。

dom4j技术进行查询操作.

使用步骤:
           1.导入jar包
           2.创建一个核心对象 SAXReader
               new SAXReader();
           3.将xml文档加载到内存中形成一棵树
               Document doc=reader.read(文件路径)
           4.获取根节点
               Element root=doc.getRootElement();
           5.通过根节点就可以获取其他节点(文本节点,属性节点,元素节点)
               获取所有的子元素
                   List<Element> list=root.elements()
               获取元素的指定属性内容
                   String value=root.attributeValue("属性名");
               获取子标签标签体:遍历list 获取到每一个子元素
               for(Element ele : list){...}
                   String text=ele.elementText("子标签名称")

[code]public static void main(String[] args) throws Excep
20000
tion {
            //创建核心对象
            SAXReader reader = new SAXReader();
            //获取dom树
            Document doc = reader.read("D:\\eclipsewk\\28\\day08\\xml\\web.xml");
            //获取根节点
            Element root=doc.getRootElement();
            //获取其他节点
            List<Element> list = root.elements();
            //遍历集合
            for (Element ele : list) {
                //获取servlet-name的标签体
                String text = ele.elementText("servlet-name");
                //System.out.println(text);
                
                //获取url-pattern标签体
                //System.out.println(ele.elementText("url-pattern"));
            }
            //获取root的version属性值
            String value = root.attributeValue("version");
            System.out.println(value);
}

xpath解析技术:(扩展)

依赖于dom4j
           使用步骤:
               1.导入jar包(dom4j和jaxen-1.1-beta-6.jar)
               2.加载xml文件到内存中
               //加载dom树
               Document doc = new SAXReader().read("E://develop//workspace//day08//xml//web.xml");
               3.使用api
                   selectNodes("表达式");
                   selectSingleNode("表达式");
                   //获取节点
                   List list = doc.selectNodes("/web-app/servlet/servlet-name");
                   Element ele = (Element) doc.selectSingleNode("//servlet/servlet-name");
           表达式的写法:
               / 从根节点选取
               // 从匹配选择的当前节点选择文档中的节点，而不考虑它们的位置
               例如一个标签下有一个id属性且有值 id=2;
                   //元素名[@属性名='属性值']
                   //元素名[@id='2']

[code]public static void main(String[] args) throws DocumentException {
        //创建核心对象
        SAXReader reader = new SAXReader();
        //获取dom树
        Document doc = reader.read("D:\\eclipsewk\\28\\day08\\xml\\web.xml");
        //获取节点
        //List<Element> list = doc.selectNodes("/web-app/servlet/servlet-name");
        //Element ele = list.get(0);
        Element ele=(Element) doc.selectSingleNode("//servlet/servlet-name");
        System.out.println(ele.getText());
}

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航