java字符集&编码问题
2016-05-20 00:00
155 查看
摘要: 乱码问题貌似困扰很多人?这一编帮助大家理解字符集与编码。
开门见山,抛出两个观点:
String没有“编码”;
byte[]没有“编码”。
牢记这两个观点有助于在处理字符集编码问题时,理清思路。
首先需要和大家一起了解下字符集的概念:
字符(Character)是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等。字符集(Character set)是多个字符的集合,字符集种类较多,每个字符集包含的字符个数不同,常见字符集名称:ASCII字符集、GB2312字符集、BIG5字符集、 GB18030字符集、Unicode字符集等。计算机要准确的处理各种字符集文字,需要进行字符编码,以便计算机能够识别和存储各种文字。中文文字数目大,而且还分为简体中文和繁体中文两种不同书写规则的文字,而计算机最初是按英语单字节字符设计的,因此,对中文字符进行编码,是中文信息交流的技术基础。
简单来说字符集就是一系列字符的集合,不同字符集包含的字符不同,如ASCII只包含了英文字符及一些控制符,而UTF-8几乎包含所有的字符(中文,日文,英文)。
那什么是编码呢?
开门见山,抛出两个观点:
String没有“编码”;
byte[]没有“编码”。
牢记这两个观点有助于在处理字符集编码问题时,理清思路。
首先需要和大家一起了解下字符集的概念:
字符(Character)是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等。字符集(Character set)是多个字符的集合,字符集种类较多,每个字符集包含的字符个数不同,常见字符集名称:ASCII字符集、GB2312字符集、BIG5字符集、 GB18030字符集、Unicode字符集等。计算机要准确的处理各种字符集文字,需要进行字符编码,以便计算机能够识别和存储各种文字。中文文字数目大,而且还分为简体中文和繁体中文两种不同书写规则的文字,而计算机最初是按英语单字节字符设计的,因此,对中文字符进行编码,是中文信息交流的技术基础。
简单来说字符集就是一系列字符的集合,不同字符集包含的字符不同,如ASCII只包含了英文字符及一些控制符,而UTF-8几乎包含所有的字符(中文,日文,英文)。
那什么是编码呢?
相关文章推荐
- Linux下修改MySQL编码的方法
- 字符集导致的浏览器跨站脚本攻击分析
- ASP编码必备的8条原则
- 基于字符集、字符编码与HTTP编码解码之万象详解
- XML指南——XML编码
- C#中字符串编码处理
- 对MySQL中字符集的相关设置操作的基本教程
- ExtJS中文乱码之GBK格式编码解决方案及代码
- 程序员趣味读物 谈谈Unicode编码
- 文本文件编码方式区别
- C语言安全编码之数值中的sizeof操作符
- C#实现获取文本文件的编码的一个类(区分GB2312和UTF8)
- mysql 字符集的系统变量说明
- 常用字符集编码详解(ASCII GB2312 GBK GB18030 unicode UTF-8)
- VC中BASE64编码和解码使用详解
- 计算机中的字符串编码、乱码、BOM等问题详解
- mysql字符集和数据库引擎修改方法分享
- Base64编码解码原理及C#编程实例
- C#编码好习惯小结
- javascript编码的几个方法详细介绍