您的位置:首页 > 编程语言 > PHP开发

解决rtrim产生乱码的问题

2016-05-26 19:59 417 查看

1、问题重现

$item = '3×魔力之源、300×10钻石、300000×金币、';
var_dump( rtrim('、', $item) );
string '3×魔力之源、300×10钻石、300000×金��' (length=47)

2、原因

rtrim函数把参数都转成了UTF8后再进行比较。
对于中文,一般都是先转成Unicode,再根据下表转成UTF8。
UCS-4(UNICODE)编码UTF-8字节流
U-00000000 – U-0000007F0xxxxxxx
U-00000080 – U-000007FF110xxxxx 10xxxxxx
U-00000800 – U-0000FFFF1110xxxx 10xxxxxx 10xxxxxx
U-00010000 – U-001FFFFF11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
U-00200000 – U-03FFFFFF111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
U-04000000 – U-7FFFFFFF1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
“币”的Unicode为\u5e01,转成二进制101111000000001,转成UTF8为11100101 10111000 10000001;
“、”的Unicode为\u3001,转成二进制  11000000000001,转成UTF8为11100011 10000000 10000001;
rtrim是一个一个字节过滤的,可见“币”的UTF8最后变成了11100101 10111000,导致出现了乱码。

3、解决方法

var_dump(mb_substr($item,0,-1,'utf-8'));
string '3×魔力之源、300×10钻石、300000×金币' 
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  乱码 php rtrim