编码类型及python中实现转换
2017-11-23 10:57
453 查看
常见编码类型
常见的编码类型为ASCII码,unicode,UTF-8,GB码等。ASCII码
ASCII码为最早编入计算机的128个字母数字和符号,为单字节(8bit为1字节)。
unicode
为了统一编码,解决各国编码语言不同的问题,unicode诞生。常为两字节。
utf-8
unicode解决了编码不同的问题,但对于英文字母是只需要单字节存储的,如果使用unicode,有时会造成不必要的空间浪费。
UTF-8编码(可变长编码)把一个Unicode字符根据不同的数字大小编码成1-6个字节,常用的英文字母被编码成1个字节,汉字通常是3个字节,只有很生僻的字符才会被编码成4-6个字节。如果你要传输的文本包含大量英文字符,用UTF-8编码就能节省空间。
GB码
GB就是“国标”的意思,即:中华人民共和国国家标准。GB码是面向汉字的编码,包括GB2312(GB2312-80),GBK,GB18030,表示范围从小到大递增,而且基本是向下兼容的。此外经常遇到一种叫做CP936的编码,实际上可以大概看做是GBK。
在计算机内存中,统一使用Unicode编码,当需要保存到硬盘或者需要传输的时候,就转换为UTF-8编码。
python中可通过如下方式查看编码类型
import chardet s = '一段测试的汉字呀' print chardet.detect(s)
编码转换
utf-8 —> GBK#先转码成unicode再转为GBK s.decode('utf-8').encode('gbk')
GBK —> utf-8
#先转码成unicode再转为utf-8 s.decode('gbk').encode('utf-8') #也可以直接指定的编码格式编码字符串 s.encoding = 'utf-8'
相关文章推荐
- python的编码类型转换
- python的编码类型转换
- Python编码类型转换方法详解
- Python中实现字符串类型与字典类型相互转换的方法
- python实现字符串类型 str 转换为 list 类型(unicode 转换为 list)
- python实现unicode转中文及转换默认编码的方法
- 在Python标准库的json包中,提供了JSONEncoder和JSONDecoder两个类来实现Json字符串和dict类型数据的互相转换。
- 在Python标准库的json包中,提供了JSONEncoder和JSONDecoder两个类来实现Json字符串和dict类型数据的互相转换
- JSON: Python Objects与String之间转换【json.dumps把python任意数据类型转换成字符串,json.loads把字符串转换为unicode编码】
- 自己实现的一个字符串编码类型转换的类(VC)
- Python编码类型转换方法详解
- Unicode 编码中文 + 未编码中文符号 转换成UTF-8 中文 python实现
- python编码类型转换及字符集探讨
- 【python实现】ip转换为Long类型
- 在Python标准库的json包中,提供了JSONEncoder和JSONDecoder两个类来实现Json字符串和dict类型数据的互相转换。
- python编码类型转换及字符集探讨
- Python中实现字符串类型与字典类型相互转换的方法
- Golang 奇葩的时间包之Json与struct对象之间互相转换,JsonDate和JsonTime自定义类型如何实现json编码和解码(二)
- 二、Struts 2的类型转换---1.Struts 2中实现自定义的类型转换
- python实现中文字符繁体和简体中文转换