python中烦人的锟斤拷(\xef\xbf\xbd)
2016-07-26 13:00
706 查看
原文链接:https://www.geek-share.com/detail/2680509200.html
首先要知道\xef\xbf\xbd是啥东西
>>> u'\uFFFD'.encode('utf-8') '\xef\xbf\xbd'
由此我们可以知道\xef\xbf\xbd是utf8编码的'\uFFFD',那么这个'\uFFFD'是啥东西呢?
原来是因为Unicode和老编码体系的转化过程中,肯定有一些字,用Unicode是没法表示的,Unicode官方用了一个占位符来表示这些文字,这就是:U+FFFD REPLACEMENT CHARACTER。
>>> "\xef\xbf\xbd".decode("utf-8") u'\ufffd'
所以,如果你的文本中有一些字符是unicode表示不了的,在python程序读入的时候就会转成\xef\xbf\xbd,如果在某些地方变成了unicode,那么内部就会变成
u'\ufffd',然而你再也不能转为str了。
如果你碰巧用到这些字符串作为字典的key,那么就会报key_error的错误了。
转载于:https://www.cnblogs.com/qwj-sysu/p/5706721.html
相关文章推荐
- python中烦人的锟斤拷(\xef\xbf\xbd)
- python 读取txt出现\xef\xbb\xbf…的问题
- python 读一个utf8编码的文本文件,为啥有\xef\xbb\xbf文件头呢?怎么处理呀
- python读取带数字的文章路径出现\xef\xbb\xbf…的问题
- python 读取txt出现\xef\xbb\xbf…的问题
- python中烦人的编码问题
- ['\xef\xbb\xbf这个什么含义? - PY技术开发交流区 - 乐讯手机高手
- Python文件编码问题(SyntaxError: Non-ASCII character '\xef' in file)
- \xef\xbb\xbf
- eclipse中 python:SyntaxError: Non-ASCII character '\xef' in file问题
- 关于\xEF\xBB\xBF的介绍
- apache出现\xef\xbb\xbf
- python 执行报错 SyntaxError: Non-ASCII character '\xef' i
- python2中烦人的编码问题图解(转帖)
- python2.X烦人的编码
- Python中的module,library,package之间的区别
- python中如何定义类
- Mac使用pyenv来进行python版本管理
- Python的zip函数
- Python的type 还是要靠isinstance判断类型