XML中特殊字符的处理方式
2014-11-24 13:42
627 查看
项目中需要解析XML,发现如果包含一些特殊字符,使用DocumentHelper.parseText(xmlString)这个方法时会报错,原因是在 XML 元素中,"<" 和 "&" 是非法的。
"<" 会产生错误,因为解析器会把该字符解释为新元素的开始。
"&" 也会产生错误,因为解析器会把该字符解释为字符实体的开始。
度娘了一下解决方法大致有两种:
一、对XML字符串中的特殊字符进行转义,代码如下:
二、采用CDATA
术语 CDATA 指的是不应由 XML 解析器进行解析的文本数据(Unparsed Character Data)
如果文本包含了很多的"<"字符和"&"字符,那么最好把他们都放到CDATA部件中。一个 CDATA 部件以"<![CDATA[" 标记开始,以"]]>"标记结束
可以参考
代码如下:
"<" 会产生错误,因为解析器会把该字符解释为新元素的开始。
"&" 也会产生错误,因为解析器会把该字符解释为字符实体的开始。
度娘了一下解决方法大致有两种:
一、对XML字符串中的特殊字符进行转义,代码如下:
/** * 替换一个字符串中的某些指定字符 * @param strData String 原始字符串 * @param regex String 要替换的字符串 * @param replacement String 替代字符串 * @return String 替换后的字符串 */ public static String replaceString(String strData, String regex, String replacement) { if (strData == null) { return null; } int index; index = strData.indexOf(regex); String strNew = ""; if (index >= 0) { while (index >= 0) { strNew += strData.substring(0, index) + replacement; strData = strData.substring(index + regex.length()); index = strData.indexOf(regex); } strNew += strData; return strNew; } return strData; } /** * 替换字符串中特殊字符 */ public static String encodeString(String strData) { if (strData == null) { return ""; } strData = replaceString(strData, "&", "&"); strData = replaceString(strData, "<", "<"); strData = replaceString(strData, ">", ">"); strData = replaceString(strData, "'", "'"); strData = replaceString(strData, "\"", """); return strData; } /** * 还原字符串中特殊字符 */ public static String decodeString(String strData) { strData = replaceString(strData, "<", "<"); strData = replaceString(strData, ">", ">"); strData = replaceString(strData, "'", "'"); strData = replaceString(strData, """, "\""); strData = replaceString(strData, "&", "&"); return strData; }
二、采用CDATA
术语 CDATA 指的是不应由 XML 解析器进行解析的文本数据(Unparsed Character Data)
如果文本包含了很多的"<"字符和"&"字符,那么最好把他们都放到CDATA部件中。一个 CDATA 部件以"<![CDATA[" 标记开始,以"]]>"标记结束
可以参考
代码如下:
<script><![CDATA[ function matchwo(a,b) { if (a < b && a < 0) then { return 1 } else { return 0 } } ]]></script>
相关文章推荐
- xml特殊字符处理的两种方式:实体引用和CDATA
- sharepoint 影响生成xml 特殊字符处理的方式
- 关于使用dom4j生成xml时特殊字符处理的解决方法
- XML中的特殊字符处理
- XML 特殊字符处理
- 关于xsl中特殊字符的处理方式
- Domino+XML开发中特殊字符处理(另,LS调用java类)
- 关于处理GET方式提交的含有特殊字符的参数jsp
- 处理XML字符串中特殊字符
- 关于处理GET方式提交的含有特殊字符的参数
- xml文件中特殊字符的处理
- XML 特殊字符处理
- xslt生成xml出现特殊字符Â处理方法
- 关于处理GET方式提交的含有特殊字符的参数
- 处理XML字符串中特殊字符
- XML配置字符串中特殊字符的处理
- 关于处理GET方式提交的含有特殊字符的参数(转载)
- C# 生成XML时的特殊字符出现异常处理
- xml 特殊字符处理
- xml特殊字符处理 如&