Python 编码问题
2016-02-14 22:11
507 查看
对于此(类)问题:
(1) 出现 UnicodeEncodeError –> 说明是Unicode编码时候的问题;
(2) ‘gbk’ codec can’t encode character –> 说明是将 Unicode 字符编码为 GBK 时候出现的问题;
此时,往往最大的可能就是,本身Unicode类型的字符中,包含了一些无法转换为GBK编码的一些字符。
解决办法是:
方案1:
在对unicode字符编码时,添加ignore参数,忽略无法无法编码的字符,这样就可以正常编码为GBK了。
方案2:
将其转换为GBK编码的超集GB18030 (即,GBK是GB18030的子集):
对应的得到的字符是GB18030的编码。
[2] 【总结】Python 2.x中常见字符编码和解码方面的错误及其解决办法
(1) 出现 UnicodeEncodeError –> 说明是Unicode编码时候的问题;
(2) ‘gbk’ codec can’t encode character –> 说明是将 Unicode 字符编码为 GBK 时候出现的问题;
此时,往往最大的可能就是,本身Unicode类型的字符中,包含了一些无法转换为GBK编码的一些字符。
解决办法是:
方案1:
在对unicode字符编码时,添加ignore参数,忽略无法无法编码的字符,这样就可以正常编码为GBK了。
gbkTypeStr = unicodeTypeStr.encode('GBK', 'ignore');
方案2:
将其转换为GBK编码的超集GB18030 (即,GBK是GB18030的子集):
gb18030TypeStr = unicodeTypeStr.encode('GB18030');
对应的得到的字符是GB18030的编码。
References
[1] 【已解决】UnicodeEncodeError: ‘gbk’ codec can’t encode character u’\u200e’ in position 43: illegal multibyte sequence[2] 【总结】Python 2.x中常见字符编码和解码方面的错误及其解决办法
相关文章推荐
- python os.path模块常用方法
- Python基础(下)
- python第一次学习笔记(简略)
- Python中的...
- Python chr ord
- python开发学习-day05(正则深入、冒泡排序算法、自定义模块、常用标准模块)
- python mock库介绍
- Python实现ID3算法决策树
- Python教程学习简记11--Python decorator 装饰器
- Python语言实践分析 -- 默认参数
- Python websocket-client库报hostname doesn't match错误
- [小技巧] Python 脚本暴力破解 HC2600 机顶盒管理密码
- python从指定范围生成多个不重复的随机数
- 修改python编码
- python调度框架APScheduler使用详解
- python paramiko小结
- 银行风控案例-python学习笔记
- python编程常用模板总结
- python+sikuli get file name and number
- python asyncore