您的位置:首页 > 编程语言 > Python开发

python3 字符编码总结

2020-06-20 17:05 344 查看

###  英语ASCII编码(1字节),中文gbk编码(2字节) -----> 世界统一unicode编码(两字节)------->utf(英1字节,中文3字节)

###  一个unicode编码可以对应多个国家编码。比如“上”在多个国家编码中都有(日文,中文,繁体),但是unicde编码都是相同的。

###  这样unicode两个字节就可以表示超过65335个字符,表示世界范围内的文字编码。

###

###   gbk/utf-8---->decode(解码)----->unicode

###   unicode----->encode(编码)------>gbk/utf-8

###

### 文件存用什么编码,读用什么编码

### Notepad++ 在编码菜单下设置存的编码。如果不采用存的编码读就会出现乱码。

### pycharm 在代码中coding:gbk申明是用gbk读,pycharm自动将用gbk存(在pycharm最下面的状态栏显示)。存和读默认是utf-8。

###

### python2 的代码中如果有字符串,字符串就是按照#coding:gbk申明的编码存(比如gbk)。但是不同的终端读采用的编码是不一样的。

### 比如windows cmd是gbk读内容,pycharm终端是utf-8读内容。这样显示python2中的gbk编码字符串,cmd可以正常显示,pycharm终端不能正常显示。

### 

### 为了解决终端不能正常显示的问题,python3代码中的字符串都是用unicode编码存。

### 如果用文字用二进制显示,就是bytes类型,是哪种字符编码类型的二进制,用encoding='xxx'(比如utf-8)表示。


内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: