您的位置:首页 > 编程语言 > PHP开发

解决PHP服务端返回json字符串有特殊字符的问题

2015-07-08 10:17 591 查看

1. 问题描述

在调用PHP后台接口发现后台接口返回的json字符串Gson一直解析不通过:

List<Region> districts = null;
if (!TextUtils.isEmpty(myString))
{
Gson gson = new Gson();
try
{
districts = gson.fromJson(myString, new TypeToken<List<Region>>()
{}.getType());
}
catch (Exception e)
{
e.printStackTrace();
}
}


异常提示的大概内容是:第一行第一列期望对象数组开头,实际却是字符串开头

以上myString 是个json字符串,内容如下:



2. 分析过程

(1) 将以上的json字符串复制到json在线检查,也是没通过

(2) json字符串保存在文件,在chrome浏览器打开此文件也没有显示json排版的格式;

(3) 仔细检查格式,没发现什么问题,根据异常提示的信息,很有可能是第一行第一列有特殊字符存在

(4) 仔细在EditPlus 编辑器查看上面的json字符串,发现 [ 很特别,不是正常的总括号

(5) 如果手动修改成正常的 [ , 复制到JSON在线检查里面,json合格,通过!

(6) 修改前的json字符串保存成一个文件,修改后的json字符串保存成一个文件

(7)为了进一步看出是这第一个什么字符,我改用了UltraEdit编辑器分别打开修改前的文件 和修改后的文件





然后分别 以16进制查看(编辑->16进制函数 -> 16进制编辑)

有特殊字符串的json字符串errorcode_region.txt 文件16进制查看内容如下:



没有特殊字符,修改后正常的json字符串 new_regions.txt 文件 16进制查看内容如下:



通过比较发现在正常的 [ 符号 多的特殊字符 16进制是 EF BB BF

通过 查看相关资料 它是 BOM (Byte Order Mark,字节序标记)的 UTF-8编码。就是说此json 字符串 是 带了 BOM的UTF-8 格式的。

以下是UTF-8 BOM的一些说明,参考 :UTF-8有BOM和无BOM的区别

UTF-8不需要BOM来表明字节顺序,但可以用BOM来表明编码方式。字符”ZERO WIDTH NO-BREAK SPACE”的UTF-8编码是EF BB BF。所以如果接收者收到以EF BB BF开头的字节流,就知道这是UTF-8编码了。

UTF- 8编码的文件中,BOM占三个字节。如果用记事本把一个文本文件另存为UTF-8编码方式的话,用UE打开这个文件,切换到十六进制编辑状态就可以看到开 头的FFFE了。这是个标识UTF-8编码文件的好办法,软件通过BOM来识别这个文件是否是UTF-8编码,很多软件还要求读入的文件必须带BOM。可 是,还是有很多软件不能识别BOM。

在Firefox早期的版本里,扩展是不能有BOM的,不过Firefox 1.5以后的版本已经开始支持BOM了。现在又发现,PHP也不支持BOM。PHP在设计时就没有考虑BOM的问题,也就是说他不会忽略UTF-8编码的文件开头BOM的那三个字符。

3. 解决办法

既然知道了问题原因:PHP后台返回的UTF-8格式的JSON字符串开头带了BOM,那解决办法就是 去掉 这个BOM。

怎样去掉呢? 不可能在客户端去掉,应该是在PHP后台根据接口名字,找到该接口对应的代码所在的PHP文件,将此PHP文件保存格式为UTF-8 无BOM 格式。

(1) 用EditPlus 另存为的时候,编码选择 UTF-8



如果选择的是 UTF-8 +BOM, 那就包含了 BOM

注: 用EditPlus 打开带BOM的文件的时候,会在底部显示 UF-8+



打开不带BOM的文件的时候,会在底部显示 UTF-8



(2) 用UltraEdit 另存为的时候,编码选择 UTF-8 无BOM



如果选择的是 UTF-8 , 那就包含了 BOM
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: