您的位置:首页 > 编程语言 > Python开发

python 字符串与字符编码

2018-03-21 21:53 267 查看
1、ASCII码与unicode码:
     a、内容大小
          ASCII码共127个。包括:大小写英文字母、数字、一些符号。
          unicode:包含所有的语言的编码。
     b、占用空间大小
          ASCII码一般为1个字节,unicode码一般为2个字节
     c、UTF-8编码
          可变长编码。把unicode字符根据不同的数字大小编码成1-6个字节。节约空间。
2、计算机中字符编码工作方式
      计算机内存中使用unicode编码,当保存或传输的时候用UTF-8编码。
      服务器会把unicode内容转为UTF-8再传输至浏览器。
      网页的源码上会有类似
<meta charset="UTF-8" />
的信息,表示该网页正是用的UTF-8编码。
3、字符 与 编码 转换
a、获取字符的编码
ord(‘---‘)
b、 获取编码对应的字符
chr(---)
'字符的十六进制编码'
4、字符str 变为 字节bytes
a=b' str '
5、将str 指定为 bytes
      'str'.encode('ascii')#纯英文
       'str'.encode('utf-8')#中文
     注意:\x## 表示:bytes无法显示为ascii
6、bytes 转为 str
    b'---'.decode('ascii')
    b'---'.decode('utf-8')
    注意:bytes中一小部分字节失效,b'---'.decode('utf-8'.errors='ignore')
7、字符个数
    str中字符个数 len('str')
    bytes的字节数 len(b'字节')
8、代码开头#!/usr/bin/env python3
# -*- coding: utf-8 -*-    第一行:告诉系统代码为python可执行

    第二行:告诉python解释器,为UTF-8编码
9、格式化字符串 %或format



指定是否补0和整数与小数的位数:



%用作普通字符



format



文章出处:点击打开链接
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: