您的位置:首页 > 其它

处理XML需要注意的几个地方

2012-07-24 00:47 447 查看
DTD中的属性类型

  全名:character data

  在标记CDATA下,所有的标记、实体引用都被忽略,而被XML处理程序一视同仁地当做字符数据看待,CDATA的形式如下:

  <![CDATA[文本内容]]>

  CDATA的文本内容中不能出现字符串“]]>”,另外,CDATA不能嵌套。

  DTD实例:

  <!ATTLIST payment type CDATA "check">

  指定类型为CDATA以后就可以在XML中被用于实例,

  例如下面payment 元素的type属性被指定为CDATA类型后在XML中就可以赋于"check"的字符数据。

  XML 实例:  

XML 解析器通常会解析 XML 文档中所有的文本。

  当某个 XML 元素被解析时,其标签之间的文本也会被解析:

  <message>此文本也会被解析</message>解析器之所以这么做是因为 XML 元素可包含其他元素,就像这个例子中,其中的 <name> 元素包含着另外的两个元素(first 和 last):

  <name><first>Bill</first><last>Gates</last></name>而解析器会把它分解为像这样的子元素:

  <name> <first>Bill</first> <last>Gates</last></name>

编辑本段转义字符

  非法的 XML 字符必须被替换为实体引用(entity reference)。

  假如您在 XML 文档中放置了一个类似 "<" 字符,那么这个文档会产生一个错误,这是因为解析器会把它解释为新元素的开始。因此你不能这样写:

  <message>if salary < 1000 then</message>为了避免此类错误,需要把字符 "<" 替换为实体引用,就像这样:

  <message>if salary < 1000 then</message>

在 XML 中有 5 个预定义的实体引用:

  

<<小于号
>>大于号
&&与(和)号
''单引号
""双引号
 注释:严格地讲,在 XML 中仅有字符 "<"和"&" 是非法的。省略号、引号和大于号是合法的,但是把它们替换为实体引用是个好的习惯。

编辑本段CDATA

  术语 CDATA 指的是不应由 XML 解析器进行解析的文本数据(Unparsed Character Data)。

  在 XML 元素中,"<" 和 "&" 是非法的。

  "<" 会产生错误,因为解析器会把该字符解释为新元素的开始。

  "&" 也会产生错误,因为解析器会把该字符解释为字符实体的开始。

  某些文本,比如 JavaScript 代码,包含大量 "<" 或 "&" 字符。为了避免错误,可以将脚本代码定义为 CDATA。

  CDATA 部分中的所有内容都会被解析器忽略。

  PHP实例:

  比如:PHP中的<div class="left floatl column"></div>,DIV中就表示:

  Attribute : class

  Data Type : CDATA

form: http://baike.baidu.com/view/1792941.htm
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: