彻底搞清楚字符编码: ASCII, ISO_8859, GB2312,UCS, Unicode, Utf-8
2016-09-20 10:50
423 查看
彻底搞清楚字符编码: ASCII, ISO_8859, GB2312,UCS, Unicode, U
1、ASCII: 0-127(128-255未使用),美国标准
2、IS0-8859-1(latin-1): 0-255, 西欧国家等
3、GB2312:常用简体中文,双字节编码,国标,对于ASCII字符仍采用单字节编码
4、GBK: GB2312的超集,包含繁体,日韩,双字节编码,不是国标(新的国标GB18030-2000是GBK的超集)
5、BIG5:繁体中文,台湾,类似GB2312
6、SJIS: 日本,类似GB2312
7、ISO10646(UCS): 31位字符集,目前仅使用0x0000-0xFFFD,即使对于ASCII字符,也以16bit为单位存储
8、Unicode: 与ISO10646互相兼容,独立发展(两者均有缺陷,对于编程来说,一些单字节的特殊字符,如'\0'等无法读取)
9、utf-8: 解决unicode编码中的缺陷,变字节编码,最多6字节,(ascii字符使用1Byte,中文3Byte)
1、ASCII: 0-127(128-255未使用),美国标准
2、IS0-8859-1(latin-1): 0-255, 西欧国家等
3、GB2312:常用简体中文,双字节编码,国标,对于ASCII字符仍采用单字节编码
4、GBK: GB2312的超集,包含繁体,日韩,双字节编码,不是国标(新的国标GB18030-2000是GBK的超集)
5、BIG5:繁体中文,台湾,类似GB2312
6、SJIS: 日本,类似GB2312
7、ISO10646(UCS): 31位字符集,目前仅使用0x0000-0xFFFD,即使对于ASCII字符,也以16bit为单位存储
8、Unicode: 与ISO10646互相兼容,独立发展(两者均有缺陷,对于编程来说,一些单字节的特殊字符,如'\0'等无法读取)
9、utf-8: 解决unicode编码中的缺陷,变字节编码,最多6字节,(ascii字符使用1Byte,中文3Byte)
相关文章推荐
- 彻底搞清楚字符编码: ASCII, ISO_8859, GB2312,UCS, Unicode, UTF8.(GBK, GB18030, BIG5, UTF-7,UTF-16,UTF-32)
- 彻底搞清楚字符编码: ASCII, ISO_8859, GB2312,UCS, Unicode, UTF8.(GBK, GB18030, BIG5, UTF-7,UTF-16,UTF-32) .
- 彻底搞清楚字符编码: ASCII, ISO_8859, GB2312,UCS, Unicode, UTF8.(GBK, GB18030, BIG5, UTF-7,UTF-16,UTF-32)
- 字符编码详解(ASCII ,utf-8,unicode,gbk,gb2312,iso 8859-1等)
- 从ASCII、ISO-8859、GB2312、GBK到Unicode的UCS-2、UCS-4、UTF-8、UTF-16、UTF-32
- 关于字符编码,你所需要知道的(ASCII,Unicode,Utf-8,GB2312…)
- 对字符编码与Unicode,ISO 10646,UCS,UTF8,UTF16,GBK,GB2312的理解
- 关于字符编码,你所需要知道的(ASCII,Unicode,Utf-8,GB2312…)
- 字符编码笔记:ASCII、Unicode、UTF-8、UTF-16、UCS、BOM、Endian
- Python的编码机制,unicode, utf-8, utf-16, GBK, GB2312,ISO-8859-1 等编码之间的转换。
- c#字符编码,System.Text.Encoding类,字符编码大全:如Unicode编码、GB18030、UTF-8,UTF-7,GB2312,ASCII,UTF32,Big5
- ascii,ISO-8859-1,unicode, utf8,gb2312,big5,gbk,gb18030等几种常区别
- 字符编码(四)ASCII,Unicode,UCS,UTF,字符&&字符编码集
- 各种编码是什么东西?(iso-8859-1 、gbk、gb2312、UniCode、ASCII、URL、URI)
- 字符编码知识:Unicode、UTF-8、ASCII、GB2312等编码之间是如何转换的?[转]
- 字符编码知识:Unicode、UTF-8、ASCII、GB2312等编码之间是如何转换的?
- ASCII/Unicode/UCS/UTF/GB字符编码
- 字符编码简介(ASCII,ISOXXX,GB2312,GBK,UNICODE,UTF-8)
- 字符编码问题,UNICODE\UTF-8\UTF-16\UTF-32\UCS\ANSI\GBK\GB2312等乱七八糟的名词
- 字符编码方式 ANSI、UNICODE、UTF-8、GB2312、GBK、DBCS、UCS