Unicode、UCS、UTF-8、UTF-16、UTF-32 的关系
2011-04-28 23:03
239 查看
Unicode、UCS、UTF-8、UTF-16、UTF-32 的关系
Unicode 是 Universal Multiple-Octet Coded Character Set 的缩写。UCS 是 Universal Character Set(通用字符集)的缩写,即某一个整数表示哪个文字。
UTF 全称是“UCS Transformation Format”,表示文件存储和数据传输时的具体格式,比如 95 这个数字,是用一个字节来存还是用两个字节来存,还是四个字节?
UTF-8 用一个或多个字节存储一个整数。
UTF-16 始终用两个字节存储一个整数。
UTF-32 始终用四个字节存储一个整数。
UTF-16、UTF-32 有一个缺点就是浪费空间,比如 ASCII 字符集中的内容完全没有必要使用两个甚至四个字节来存储,而 UTF-8 就解决了空间这个问题。
我们通常所说的 Unicode,实际上是指某一种 UTF,比如:Windows 记事本中为 UTF-16,IE 浏览器中为 UTF-8。
相关文章推荐
- 彻底搞清楚字符编码: ASCII, ISO_8859, GB2312,UCS, Unicode, UTF8.(GBK, GB18030, BIG5, UTF-7,UTF-16,UTF-32)
- 从ASCII、ISO-8859、GB2312、GBK到Unicode的UCS-2、UCS-4、UTF-8、UTF-16、UTF-32
- UTF-8/UTF-16/UTF-32、Unicode和GB18030编码的关系
- 彻底搞清楚字符编码: ASCII, ISO_8859, GB2312,UCS, Unicode, UTF8.(GBK, GB18030, BIG5, UTF-7,UTF-16,UTF-32) .
- unicode、ucs-2、ucs-4、utf-16、utf-32、utf-8介绍
- 细说:Unicode, UTF-8, UTF-16, UTF-32, UCS-2, UCS-4
- 【编码】unicode、ucs-2、ucs-4、utf-16、utf-32、utf-8 介绍
- Unicode 与(UTF-8,UTF-16,UTF-32,UCS-2)
- Unicode,utf-8,utf-16,utf-32,ucs16,ucs32关系
- Unicode详解(UCS-2,UCS-4,UTF-8,UTF-16,UTF-32)
- unicode、ucs-2、ucs-4、utf-16、utf-32、utf-8
- UCS unicode UTF-8 UTF-16 UTF-32
- Unicode,utf-8,utf-16,utf-32,ucs16,ucs32关系
- unicode、ucs-2、ucs-4、utf-16、utf-32、utf-8
- 彻底搞清楚字符编码: ASCII, ISO_8859, GB2312,UCS, Unicode, UTF8.(GBK, GB18030, BIG5, UTF-7,UTF-16,UTF-32)
- 字符编码笔记:ASCII、Unicode、UTF-8、UTF-16、UCS、BOM、Endian
- gbk, gb2312,big5,unicode,utf-8,utf-16之间的关系
- 彻底搞懂字符编码(unicode,mbcs,utf-8,utf-16,utf-32,big endian,little endian...)
- utf-8,utf-16,unicode等编码的关系与深入说明
- Introduction of Encoding: UTF-16/UCS-2/Unicode/GBK