您的位置:首页 > 其它

处理utf-8中文文本,程序莫名出错中断

2016-01-18 18:44 183 查看
由于中文使用utf-8编码时,编码可用的位数有限,所以并不能针对所有中文汉字进行编码。

中文汉字大约有五六万个(具体我也不清楚),但是utf-8编码的中文汉字好像只有两万字左右,因此,大量比较生僻的汉字未能编码,所以,处理包含这些字符的文本时,可能出错,但是没有办法,直接删除掉那些语句就OK了。或者也可以将编码改为Unicode。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: