计算机编码原理 以Python为例的解析
2018-01-17 18:57
281 查看
美国人发明了uscii,只包括数字字符和一些字符。于是中国人就制定了GB2312。后来为了统一世界的语言制定了UTF-8。 在Pyhton中一个方法是ord():将字符转换为十进制码,这个十进制码就代表编码表中字符的编码, A的编码为65。 >>> '\u4e2d\u6587' '中文' 在python中输入以前编码会输出中文,\u4e2d\u6587其实代表十六进制,十进制为20013 25991,这些数字又可以有不同的字节数,随编码格式的不同变化,例如utf-8为三个字节(除偏僻中文),gbk为两个字节。比如用utf8,20013转换为字节流就为"\xe4\xb8\ad",用gbk 转换为"\xd6\xd0",但不管如何转换最终都是十进制20013 十六进制\u4e2d。 具体20013是如何转换为\xe4\xb8\ad 的编码规则为 Unicode符号范围 | UTF-8编码方式
(十六进制) (十进制) | (二进制)
—————————————————————————————————-
0000 0000-0000 007F (0-127) | 0xxxxxxx
0000 0080-0000 07FF (128-2047) | 110xxxxx 10xxxxxx
0000 0800-0000 FFFF (2048-65535) | 1110xxxx 10xxxxxx 10xxxxxx
0001 0000-0010 FFFF (65536-1114111) | 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
参考:https://www.cnblogs.com/leesf456/p/5317574.html
相关文章推荐
- 24. Dubbo原理解析-编码解码之编码解码流程
- Spring第七弹—依赖注入之注解方式注入及编码解析@Resource原理
- 逐渐了解python搜索原理 - 笔记:udacity计算机科学导论18/1-12
- 音视频同步原理解析;音频编码和解码原理
- java字符编码原理解析
- 计算机是如何支持中文的? ――国际化和本地化、字符集和编码等问题解析
- python2.7 编码问题解析(一)
- java字符编码原理解析
- (7) 用@Resource注解完成属性装配 【依赖注入----手动装配】 以及 编码解析其原理【经典】
- Base64编码原理解析与Java实现
- Python中文编码深入解析
- Python解析xml文件遇到的编码解析的问题
- java字符编码原理解析
- Atitit.sql ast 表达式 语法树 语法 解析原理与实现 java php c#.net js python
- 音视频同步原理解析;音频编码和解码原理
- python编码全解析
- 史上最通俗的海明码编码计算、检错和纠错原理解析
- Atitit.sql ast 表达式 语法树 语法 解析原理与实现 java php c#.net js python
- python2.7 编码问题解析(二)
- [python爬虫]对html解析读取编码格式,统一转码为utf-8