关于编码字符,unicode的介绍
2016-08-15 00:00
260 查看
Unicode 是用两个字节表示每个字符的字符编码方案。国际标准组织 (ISO) 几乎为每种语言的每个字符和符号在 0 到 65,535 (216 – 1) 范围内定义了一个数字(再加上为将来发展保留的一些空余空间)。在所有 32 位版本的 Windows 中,部件对象模型 (COM) 都使用 Unicode,它是 OLE 和 ActiveX 技术的基础。Windows NT 全部支持 Unicode。虽然 Unicode 和 DBCS 都是双字节字符,但它们的编码方案完全不同
Unicode给每个字符提供了一个唯一的数字,不论是什么平台,不论是什么程序,不论什么语言。Unicode使单一软件产品或单一网站能够贯穿多个平台,语言和国家,而不需要重建。它可将数据传输到许多不同的系统,而无损坏。
产生的环境:
基本上,计算机只是处理数字。它们指定一个数字,来储存字母或其他字符。在创造Unicode之前,有数百种指定这些数字的编码系统。没有一个编码可以包含足够的字符:例如,单单欧州共同体就需要好几种不同的编码来包括所有的语言。即使是单一种语言,例如英语,也没有哪一个编码可以适用于所有的字母,标点符号,和常用的技术符号。
这些编码系统也会互相冲突。也就是说,两种编码可能使用相同的数字代表两个不同的字符,或使用不同的数字代表相同的字符。任何一台特定的计算机(特别是服务器)都需要支持许多不同的编码,但是,不论什么时候数据通过不同的编码或平台之间,那些数据总会有损坏的危险。
来自:
http://www.joelonsoftware.com/articles/Unicode.html http://dengo.org/archives/901 http://zhidao.baidu.com/link?url=ELut17y7pesezRTI7y4DPgiIChLk-q8z_-o7MT2iqlcttAFcVtd7oVEtfnA1m421tgs85-hFJTCIn1DskgM5_K
Unicode给每个字符提供了一个唯一的数字,不论是什么平台,不论是什么程序,不论什么语言。Unicode使单一软件产品或单一网站能够贯穿多个平台,语言和国家,而不需要重建。它可将数据传输到许多不同的系统,而无损坏。
产生的环境:
基本上,计算机只是处理数字。它们指定一个数字,来储存字母或其他字符。在创造Unicode之前,有数百种指定这些数字的编码系统。没有一个编码可以包含足够的字符:例如,单单欧州共同体就需要好几种不同的编码来包括所有的语言。即使是单一种语言,例如英语,也没有哪一个编码可以适用于所有的字母,标点符号,和常用的技术符号。
这些编码系统也会互相冲突。也就是说,两种编码可能使用相同的数字代表两个不同的字符,或使用不同的数字代表相同的字符。任何一台特定的计算机(特别是服务器)都需要支持许多不同的编码,但是,不论什么时候数据通过不同的编码或平台之间,那些数据总会有损坏的危险。
来自:
http://www.joelonsoftware.com/articles/Unicode.html http://dengo.org/archives/901 http://zhidao.baidu.com/link?url=ELut17y7pesezRTI7y4DPgiIChLk-q8z_-o7MT2iqlcttAFcVtd7oVEtfnA1m421tgs85-hFJTCIn1DskgM5_K
相关文章推荐
- [系统] Solr 介绍以及 XML 中特殊字符 Unicode 编码
- 字符编码浅识:关于Unicode与UTF-8
- 关于JAVA字符编码:Unicode,ISO-8859-1,GBK,UTF-8编码及相互转换
- [系统] Solr 介绍以及 XML 中特殊字符 Unicode 编码
- 计算机中字符的Unicode编码,简要介绍UCS、UTF、BMP、BOM,字序等名词
- 关于JAVA字符编码:Unicode,ISO-8859-1,GBK,UTF-8编码及相互转换
- 关于JAVA字符编码:Unicode,ISO-8859-1,GBK,UTF-8编码及相互转换
- Unicode中关于中文和其他特殊字符的编码范围
- 计算机中字符的Unicode编码,简要介绍UCS、UTF、BMP、BOM,字序等名词
- 关于中文字符UNICODE编码的三个问题(基于此可以求中文字符的笔划和首拼)
- 关于字符、字符集、编码和Unicode
- Unicode中关于中文和其他特殊字符的编码范围
- 2.数码相框-编码(ASCII/GB2312/Unicode)介绍,并使LCD显示汉字字符(2)
- 关于JAVA字符编码:Unicode,ISO-8859-1,GBK,UTF-8编码及相互转换
- 看到两个写的很好的关于字符集,编码的文章,推荐大家看看,另外纠正了一下原文中的小bug(UTF-8 UniCode UTF-16 UCS 等)
- JavaScript 实现字符与unicode编码的相互转换
- 关于java编码方案的关键词(unicode-16)
- 字符编码笔记:ASCII,Unicode和UTF-8
- 字符编码简介:ASCII,Unicode,UTF-8,GB2312