流畅的Python 第4章: 文本和字节序列
2018-01-28 16:09
405 查看
1. unicode 编码与解码
2. 二进制序列类型
3 . 标准化unicode文本
在 Unicode 中,某些字符能够用多个合法的编码表示,使用unicodedata将其标准化
>>> s = 'café' >>> len(s) 4 >>> b = s.encode('utf8') >>> b b'caf\xc3\xa9' >>> len(b) 5 >>> b.decode('utf8') 'café'
2. 二进制序列类型
bytes 或 bytearray 对象的各个元素是介于 0~255(含)之间的整数 >>> cafe = bytes('café', encoding='utf_8') >>> cafe b'caf\xc3\xa9' >>> cafe_arr = bytearray(cafe) >>> cafe_arr bytearray(b'caf\xc3\xa9') >>>
3 . 标准化unicode文本
在 Unicode 中,某些字符能够用多个合法的编码表示,使用unicodedata将其标准化
>>> s1 = 'Spicy Jalape\u00f1o' >>> s2 = 'Spicy Jalapen\u0303o' >>> s 'café' >>> s2 'Spicy Jalapeño' >>> s1 == s2 False >>> import unicodedata >>> t1 = unicodedata.normalize('NFC', s1) >>> t2 = unicodedata.normalize('NFC', s2) >>> t1 == t2 True >>> print(ascii(t1)) 'Spicy Jalape\xf1o' >>>
相关文章推荐
- 流畅的python第四章文本和字节序列学习记录
- 流程的Python 第四章:文本和字节序列
- Python 文本和字节序列
- 流畅的Python 第二章:序列构成的数组
- 流畅的python第十章序列的修改,散列和切片学习记录
- python pd.crosstab在处理时间序列文本数据的用处
- 流畅的python之序列
- IDA.【转】5.IDA-文本搜索、二进制搜索(16进制字节序列)、替换16进制
- Python学习笔记015——序列(字节数组 bytearray)
- 流畅的python第二章序列构成的数组学习记录
- 5.IDA-文本搜索、二进制搜索(16进制字节序列)、替换16进制
- python读取指定字节长度的文本
- 将文本序列映射到python字典push至open-falcon监控平台
- python读取指定字节长度的文本
- python 之pickle模块--输出保存到文本(基本的数据序列和反序列化)
- 5.IDA-文本搜索、二进制搜索(16进制字节序列)、替换16进制
- Python数据类型之“文本序列(Text Sequence)”
- 『流畅的Python』第10章_序列类型
- 5.IDA-文本搜索、二进制搜索(16进制字节序列)、替换16进制
- python pd.crosstab在处理时间序列文本数据的用处