您的位置:首页 > 编程语言 > Java开发

char可以存储汉字吗?| Java基础

2016-03-25 12:02 1221 查看
可以!

public static void main(String[] args) {
char c='李';
System.out.println(c);
String s="周";
System.out.println(s);
}
}
李
周
String存储汉字很好理解的,char是如何存储汉字的呢?

char是按照字符存储的,不管英文还是中文,固定占用占用2个字节,用来储存Unicode字符。范围在0-65536。

unicode编码字符集中包含了汉字,所以,char型变量中当然可以存储汉字啦。不过,如果某个特殊的汉字没有

被包含在unicode编码字符集中,那么,这个char型变量中就不能存储这个特殊汉字。

如果用3个字节有很多不常用的字又占了很多不必要的存储空间,所以我们用2个字节而不是1个或者3个表示汉字的国际码。

补充说明:

1. unicode编码固定占用两个字节,所以,char类型的变量也是占用两个字节。Unicode(统一码、万国码、

单一码)是一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,

以满足跨语言、跨平台进行文本转换、处理的要求。传统的编码方式存在的缺陷:

①在不同的编码方案下有可能对应不同的字母

②采用大字符集的语言其编码长度可能不同

目前的用于实用的 Unicode 版本对应于 UCS-2,使用16位的编码空间。也就是每个字符占用2个字节。

2. 不同的看编码占据字节数也不同:utf-32中文是4字节;

utf-8码的中文都是3字节的,字母是1字节,因为utf-8是变长编码;

而 gbk/gbk18030 中文是2字节的,英文是1个字节。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: