您的位置:首页 > 编程语言 > Java开发

String类型为什么是不可改变的?

2017-09-07 00:00 363 查看
摘要: 众所周知, 在Java中String类是不可变的。那么到底什么是不可变的对象呢? 可以这样认为:如果一个对象,在它创建完成之后,不能再改变它的状态,那么这个对象就是不可变的。不能改变状态的意思是,不能改变对象内的成员变量,包括基本数据类型的值不能改变,引用类型的变量不能指向其他的对象,引用类型指向的对象的状态也不能改变。

1. String为什么不可变?

翻开JDK源码,java.lang.String类起手前三行,是这样写的:

public final class String implements java.io.Serializable, Comparable<String>, CharSequence {
/**String本质是个char数组. 而且用final关键字修饰
* The value is used for character storage. */
private final char value[];
/** Cache the hash code for the string */
private int hash; // Default to 0

首先String类是用final关键字修饰,这说明String不可继承。再看下面,String类的主力成员字段value是个char[ ]数组而且是用final修,饰的。final修饰的字段创建以后就不可改变。

有的人以为故事就这样完了,其实没有。因为虽然value是不可变,也只是value这个引用地址不可变。挡不住Array数组是可变的事实。Array的数据结构看下图:



也就是说Array变量只是stack上的一个引用,数组的本体结构在heap堆。String类里的value用final修饰,只是说stack里的这个叫value的引用地址不可变。没有说堆里array本身数据不可变。看下面这个例子,



value用final修饰,编译器不允许我把value指向堆区另一个地址(非final的b就可以让value指向)。但如果我直接对数组元素动手,此时a数组变成[1,2,3,100]。



所以,string的值也不是绝对的不可变,可以利用Java的反射技术获取到private final char [] value;中的value,设置私有可访问,然后来更改value中的值如下例:

public static void main(String[] args){
try {
String str = "hello,world";
Field declaredField = String.class.getDeclaredField("value");
declaredField.setAccessible(true);
char[] charstr = (char[]) declaredField.get(str);
charstr[5] = '-';
System.out.println(str);// 输出str的值为 hello-world
} catch (Exception e) {
e.printStackTrace();
}
}


总而言之String不可变,关键是因为SUN公司的工程师,在后面所有String的方法里很小心的没有去动Array里的元素,没有暴露内部成员字段。private final char value[]这一句里,private的私有访问权限的作用都比final大。而且设计师还很小心地把整个String设成final禁止继承,避免被其他人继承后破坏。所以String是不可变的关键都在底层的实现,而不是一个final。(主要关键点:私有化的value,final修饰的类不可被继承,没有暴露成员字段更没有暴露相关更改字段的方法 )

2. 不可变有什么好处?

只有当字符串是不可变的,字符串池才有可能实现。字符串池的实现可以在运行时节约很多heap空间,因为不同的字符串变量都指向池中的同一个字符串。但如果字符串是可变的,那么String interning将不能实现(String interning是指对不同的字符串仅仅只保存一个,即不会保存多个相同的字符串),因为这样的话,如果变量改变了它的值,那么其它指向这个值的变量的值也会一起改变。

如果字符串是可变的,那么会引起很严重的安全问题。譬如,数据库的用户名、密码都是以字符串的形式传入来获得数据库的连接,或者在socket编程中,主机名和端口都是以字符串的形式传入。因为字符串是不可变的,所以它的值是不可改变的,否则黑客们可以钻到空子,改变字符串指向的对象的值,造成安全漏洞。

因为字符串是不可变的,所以是多线程安全的,同一个字符串实例可以被多个线程共享。这样便不用因为线程安全问题而使用同步。字符串自己便是线程安全的。

类加载器要用到字符串,不可变性提供了安全性,以便正确的类被加载。譬如你想加载java.sql.Connection类,而这个值被改成了myhacked.Connection,那么会对你的数据库造成不可知的破坏。

因为字符串是不可变的,所以在它创建的时候hashcode就被缓存了,不需要重新计算。这就使得字符串很适合作为Map中的键,字符串的处理速度要快过其它的键对象。这就是HashMap中的键往往都使用字符串。

参考链接:

https://www.2cto.com/kf/201401/272974.html

https://www.zhihu.com/question/20618891/answer/147575525
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  String java