java虚拟机采用UTF-16编码格式对字符进行编码
2018-01-21 11:40
363 查看
转自: https://www.ibm.com/developerworks/cn/java/j-lo-chinesecoding/
【UTF-16】
说到 UTF 必须要提到 Unicode(Universal Code 统一码),ISO 试图想创建一个全新的超语言字典,世界上所有的语言都可以通过这本字典来相互翻译。可想而知这个字典是多么的复杂,关于 Unicode 的详细规范可以参考相应文档。Unicode 是 Java 和 XML 的基础,下面详细介绍 Unicode 在计算机中的存储形式。
UTF-16 具体定义了 Unicode 字符在计算机中存取方法。UTF-16 用两个字节来表示 Unicode 转化格式,这个是定长的表示方法,不论什么字符都可以用两个字节表示,两个字节是 16 个 bit,所以叫 UTF-16。UTF-16 表示字符非常方便,每两个字节表示一个字符,这个在字符串操作时就大大简化了操作,这也是 Java 以 UTF-16 作为内存的字符存储格式的一个很重要的原因。 这也是为什么 java字符占用两个字节的原因。
【UTF-16】
说到 UTF 必须要提到 Unicode(Universal Code 统一码),ISO 试图想创建一个全新的超语言字典,世界上所有的语言都可以通过这本字典来相互翻译。可想而知这个字典是多么的复杂,关于 Unicode 的详细规范可以参考相应文档。Unicode 是 Java 和 XML 的基础,下面详细介绍 Unicode 在计算机中的存储形式。
UTF-16 具体定义了 Unicode 字符在计算机中存取方法。UTF-16 用两个字节来表示 Unicode 转化格式,这个是定长的表示方法,不论什么字符都可以用两个字节表示,两个字节是 16 个 bit,所以叫 UTF-16。UTF-16 表示字符非常方便,每两个字节表示一个字符,这个在字符串操作时就大大简化了操作,这也是 Java 以 UTF-16 作为内存的字符存储格式的一个很重要的原因。 这也是为什么 java字符占用两个字节的原因。
相关文章推荐
- [置顶] FFmpeg学习—解决ffmpeg 进行Audio 编码 采用AV_SAMPLE_FMT_S16 格式报 Input contains NaN/+-Inf 错误的问题
- Android对URl中的中文字符进行utf-8格式编码
- 字符编码的故事:ASCII,GB2312,Unicode,UTF-8,UTF-16
- 字符编码:Unicode/UTF-8/UTF-16/UCS/Endian/BMP/BOM
- 字符编码: ANSI/UTF-8/UCS2(UTF-16),以及回车换行
- 中文字符编码之GBK,UTF-16和UTF-8
- 字符编码 ansi, unicode, utf-8, utf-16
- 【字符集及字符编码】UTF-8、UTF-16和UTF-32
- 中文字符编码之GBK,UTF-16和UTF-8
- 判断字符流是不是UTF-8编码格式(读取文本文件需要转码时使用)
- 字符编码 Unicode UTF-8 UTF-16 UTF-32 ANSI
- Java编码格式是UTF-8?UTF-16?
- 用java程序将GBK字符转成UTF-8编码格式(转)
- php和mysql采用utf-8编码时实现按照一个文本字段的首字母的拼音顺序进行排序的方法
- 用java程序将GBK字符转成UTF-8编码格式
- Java中的UTF-8、UTF-16编码字符所占字节数
- 也谈字符编码 ascii gb2312 gbk gb13080 unicode utf-8 utf-16 utf-32
- 字符编码:ASCII、Unicode、UTF-8、UTF-16、UCS、BOM、Endian
- java程序将GBK字符转成UTF-8编码格式
- 字符编码之ASCII、UTF-8、UTF-16的区别