关于python编码的一些理解
2015-11-18 17:13
666 查看
以前一直对中文编码很模糊,没有搞清楚原理,觉得能用就行。最近看了NLTK的教材,有一些简单的理解,记下来。
外部编码———》decode——》Unicode——》encode——》外部编码。
python内部处理都用unicode.所有过程都是解码和编码的转换。
中文是gbk。通常遇到的中文乱码是utf-8。
string.decode()
string.encode()
遇到问题用上面的关系转换一下就行。
我觉得理解了本质,就不会迷糊了。
外部编码———》decode——》Unicode——》encode——》外部编码。
python内部处理都用unicode.所有过程都是解码和编码的转换。
中文是gbk。通常遇到的中文乱码是utf-8。
string.decode()
string.encode()
遇到问题用上面的关系转换一下就行。
我觉得理解了本质,就不会迷糊了。
相关文章推荐
- LeetCode OJ 系列之26 Remove Duplicates from Sorted Array --Python
- python的参数
- 使用Python 2.7实现的垃圾短信识别器
- python用requests请求百度接口报“SSL: CERTIFICATE_VERIFY_FAILED”
- Python学习指南
- python3输出unicode
- Python中list的实现
- Python处理Json报文
- 【python】class之子类
- python 抽象类、抽象方法的实现
- 安装python MySQLdb报错:pymemcompat.h:10:20: 致命错误的解决
- scikit学习心得——Isotonic Regression
- Python编写微信打飞机小游戏(十二)
- Difference between Range and Xrange in Python
- 折腾Ipython
- 第一个Python程序——博客自动访问脚本
- Python基础学习-爬虫小试2
- python插件
- Python学习小记
- 让cherrypy监听系统内所有活动网卡传入的请求