您的位置:首页 > 编程语言 > Java开发

Java String类的hashCode()函数

2015-05-10 21:46 357 查看

1 ==和equals()

==比较两个对象是否指向同一个内存地址。

equals()方法判断两个对象的值是否相等。

2 String.equals()

String类对equals()方法重写如下:

public boolean equals(Object anObject) {
if (this == anObject) {
return true;
}
if (anObject instanceof String) {
String anotherString = (String) anObject;
int n = value.length;
if (n == anotherString.value.length) {
char v1[] = value;
char v2[] = anotherString.value;
int i = 0;
while (n-- != 0) {
if (v1[i] != v2[i])
return false;
i++;
}
return true;
}
}
return false;
}


String、StringBuffer及StringBuilder是两两不equals()的。如果需要,使用contentEquals()。

3 String.hashCode()

判断对象值是否相等时,会先判断其hashCode是否相等。如果hashCode不相等,则equals()方法返回false;不然,再进行比较。

jvm默认hashCode不相等,则对象值也不相等。其逆反命题是:若对象值相等,则其hashCode也相等。

重写equals()时,必须也重写hashCode()。并且需要保证,值相等的对象,有相同的hashCode。

public int hashCode() {
int h = hash;
if (h == 0 && value.length > 0) {
char val[] = value;

for (int i = 0; i < value.length; i++) {
h = 31 * h + val[i];
}
hash = h;
}
return h;
}


hash值的计算方式大概是这个样子:

hash(k) = mix(k) mod m


String类中:

mix(k) = 31 * k


这里魔法数字选择31的原因是:

* 这里hash是int型,则有m = 2^p。这里魔法数字为2的倍数时,除String对象的最后一位,其他位的信息均不能hash到奇数桶中。也就是说,String对象最后一位的分布决定了哈希函数的分布。由此可推断,魔法数字不该与m有公约数。

* 素数可以使得散列的分布更加均匀。

* 乘以31计算简单,只需一次移位一次减法操作。

* 31是大于26的素数中,最小的。越小,溢出的可能性就越低。

这里1、3、4的含义是自现的,而2,目前还没有明确的证明。

个人觉得,只要是奇数,都是可行的。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: