您的位置:首页 > 其它

编码方式

2015-07-04 16:44 351 查看
ASCII编码:采用8位的字节来表示数符,将前0~127号编码用于表示标点符号,数字,大小写字母。后面128~255号用于表示其他内容。

GB2312:是ASCII的中文扩展。因为当计算机进入中国之后,如何显示中文成为了问题,之前美国使用计算机的时候,使用ASCII编码就已经足够表示所有内容了。中文中光常用汉字就多达6000+。GB2312编码是这样的,当一个字节的值小于127那么其字符内容是与ASCII一样的。将两个大于127的字符连接在一起的时候就表示一个汉字,前一个字节取值范围为0xA1~0xF7,后一个字节取值范围为0xA1~0xFE,为什么不使用全部的内容,那样可以表示30000+个汉字是因为,在GB2312编码中,将数字符号,罗马希腊的字母,日文的假名等都编进去了,原来在ASCII中本来就有的数字、标点等重新编了两个字节长的编码,这就是所谓的“全角字符”,127以下的是“半角字符”。

GBK编码:是在GB2312上的扩展,不用两个都大于127的字节表示汉子,而是只要有一个字节大于127,那么这就表示一个汉字的开始。GBK包括了GB2312的所有内容,增加了新的汉字(包括繁体字)和符号。

GB18030:是对GBK的扩展,增加了少数民族的字。

UNICODE:用于国际化的标准,统一规定使用两个字节来表示所有的字符,对于ASCII中的字符,由原来的8为扩展了16位。

UTF-8和UTF-16是UNICODE中的两个标准

UTF-8每次传输8位

UTF-16每次传输16位
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: