您的位置:首页 > 编程语言 > Java开发

java字符集&编码问题

2016-05-20 00:00 155 查看
摘要: 乱码问题貌似困扰很多人?这一编帮助大家理解字符集与编码。

开门见山,抛出两个观点:

String没有“编码”;

byte[]没有“编码”。

牢记这两个观点有助于在处理字符集编码问题时,理清思路。

首先需要和大家一起了解下字符集的概念:

字符(Character)是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等。字符集(Character set)是多个字符的集合,字符集种类较多,每个字符集包含的字符个数不同,常见字符集名称:ASCII字符集、GB2312字符集、BIG5字符集、 GB18030字符集、Unicode字符集等。计算机要准确的处理各种字符集文字,需要进行字符编码,以便计算机能够识别和存储各种文字。中文文字数目大,而且还分为简体中文和繁体中文两种不同书写规则的文字,而计算机最初是按英语单字节字符设计的,因此,对中文字符进行编码,是中文信息交流的技术基础。

简单来说字符集就是一系列字符的集合,不同字符集包含的字符不同,如ASCII只包含了英文字符及一些控制符,而UTF-8几乎包含所有的字符(中文,日文,英文)。

那什么是编码呢?
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  编码 字符集