您的位置:首页 > 其它

XML中特殊字符的处理方式

2014-11-24 13:42 627 查看
项目中需要解析XML,发现如果包含一些特殊字符,使用DocumentHelper.parseText(xmlString)这个方法时会报错,原因是在 XML 元素中,"<" 和 "&" 是非法的。

"<" 会产生错误,因为解析器会把该字符解释为新元素的开始。
"&" 也会产生错误,因为解析器会把该字符解释为字符实体的开始。

度娘了一下解决方法大致有两种:

一、对XML字符串中的特殊字符进行转义,代码如下:

/**
* 替换一个字符串中的某些指定字符
* @param strData String 原始字符串
* @param regex String 要替换的字符串
* @param replacement String 替代字符串
* @return String 替换后的字符串
*/
public static String replaceString(String strData, String regex,
String replacement)
{
if (strData == null)
{
return null;
}
int index;
index = strData.indexOf(regex);
String strNew = "";
if (index >= 0)
{
while (index >= 0)
{
strNew += strData.substring(0, index) + replacement;
strData = strData.substring(index + regex.length());
index = strData.indexOf(regex);
}
strNew += strData;
return strNew;
}
return strData;
}

/**
* 替换字符串中特殊字符
*/
public static String encodeString(String strData)
{
if (strData == null)
{
return "";
}
strData = replaceString(strData, "&", "&");
strData = replaceString(strData, "<", "<");
strData = replaceString(strData, ">", ">");
strData = replaceString(strData, "'", "'");
strData = replaceString(strData, "\"", """);
return strData;
}

/**
* 还原字符串中特殊字符
*/
public static String decodeString(String strData)
{
strData = replaceString(strData, "<", "<");
strData = replaceString(strData, ">", ">");
strData = replaceString(strData, "'", "'");
strData = replaceString(strData, """, "\"");
strData = replaceString(strData, "&", "&");
return strData;
}


二、采用CDATA

术语 CDATA 指的是不应由 XML 解析器进行解析的文本数据(Unparsed Character Data)

如果文本包含了很多的"<"字符和"&"字符,那么最好把他们都放到CDATA部件中。一个 CDATA 部件以"<![CDATA[" 标记开始,以"]]>"标记结束

可以参考

代码如下:

<script><![CDATA[ function matchwo(a,b) { if (a < b && a < 0) then { return 1 } else { return 0 } } ]]></script>
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: