编码方式
2015-07-04 16:44
351 查看
ASCII编码:采用8位的字节来表示数符,将前0~127号编码用于表示标点符号,数字,大小写字母。后面128~255号用于表示其他内容。
GB2312:是ASCII的中文扩展。因为当计算机进入中国之后,如何显示中文成为了问题,之前美国使用计算机的时候,使用ASCII编码就已经足够表示所有内容了。中文中光常用汉字就多达6000+。GB2312编码是这样的,当一个字节的值小于127那么其字符内容是与ASCII一样的。将两个大于127的字符连接在一起的时候就表示一个汉字,前一个字节取值范围为0xA1~0xF7,后一个字节取值范围为0xA1~0xFE,为什么不使用全部的内容,那样可以表示30000+个汉字是因为,在GB2312编码中,将数字符号,罗马希腊的字母,日文的假名等都编进去了,原来在ASCII中本来就有的数字、标点等重新编了两个字节长的编码,这就是所谓的“全角字符”,127以下的是“半角字符”。
GBK编码:是在GB2312上的扩展,不用两个都大于127的字节表示汉子,而是只要有一个字节大于127,那么这就表示一个汉字的开始。GBK包括了GB2312的所有内容,增加了新的汉字(包括繁体字)和符号。
GB18030:是对GBK的扩展,增加了少数民族的字。
UNICODE:用于国际化的标准,统一规定使用两个字节来表示所有的字符,对于ASCII中的字符,由原来的8为扩展了16位。
UTF-8和UTF-16是UNICODE中的两个标准
UTF-8每次传输8位
UTF-16每次传输16位
GB2312:是ASCII的中文扩展。因为当计算机进入中国之后,如何显示中文成为了问题,之前美国使用计算机的时候,使用ASCII编码就已经足够表示所有内容了。中文中光常用汉字就多达6000+。GB2312编码是这样的,当一个字节的值小于127那么其字符内容是与ASCII一样的。将两个大于127的字符连接在一起的时候就表示一个汉字,前一个字节取值范围为0xA1~0xF7,后一个字节取值范围为0xA1~0xFE,为什么不使用全部的内容,那样可以表示30000+个汉字是因为,在GB2312编码中,将数字符号,罗马希腊的字母,日文的假名等都编进去了,原来在ASCII中本来就有的数字、标点等重新编了两个字节长的编码,这就是所谓的“全角字符”,127以下的是“半角字符”。
GBK编码:是在GB2312上的扩展,不用两个都大于127的字节表示汉子,而是只要有一个字节大于127,那么这就表示一个汉字的开始。GBK包括了GB2312的所有内容,增加了新的汉字(包括繁体字)和符号。
GB18030:是对GBK的扩展,增加了少数民族的字。
UNICODE:用于国际化的标准,统一规定使用两个字节来表示所有的字符,对于ASCII中的字符,由原来的8为扩展了16位。
UTF-8和UTF-16是UNICODE中的两个标准
UTF-8每次传输8位
UTF-16每次传输16位
相关文章推荐
- Redis Mac 安装及简单命令使用
- 提高经济运行质量的问题与对策
- memcache最长有效期是多久?
- 关于thinkphp3.2中使用smarty模板success调转失败的解决办法
- POSIX线程-条件变量(一)
- 注册机的使用
- 集群技术(三)MySQL集群深度解析
- JDBC
- 企业监控与信息管理强大助手-逐浪舆情系统交付商用
- 集群技术(三)MySQL集群深度解析
- 条款38 通过复合塑膜出has-a或"根据某物实现"
- 返回值为 Record类型的函数 初始化 Result
- WexinPay for WooCommerce
- DB2 EXPRESS-C 10.1 数据库安装问题解决
- web错误
- 邓小平社会主义市场经济理论要点
- ubuntu14.04 搭建FTP服务器 -- vsftpd的安装和配置
- "wc" in shell
- C#图片处理示例(裁剪,缩放,清晰度,水印)
- javascript作用域