您的位置：首页 > 编程语言 > Java开发

Java 中的 hashcode一

2016-04-07 22:10 429 查看

哈希表这个数据结构我们都很清楚，而且在很多地方都会利用hash表来提高查询效率。在Java的Object类中有一个方法：
public native int hashCode();

根据这个方法的声明可知：该方法返回一个int 类型的值，并且是本地方法。
为什么在Object中会有这样一个方法，他有什么作用？

一、hashcode方法的作用

对于包含容器类型的程序设计语言，基本上都会涉及到hashCode。在Java中也一样，hashCode方法的作用是为了配合基于散列的集合一起正常运行，这样的散列集合包括HashSet、HashMap和Hashtable。
为什么这么说？考虑一种情况，当向集合中插入对象的时候，如何判断在集合中是否已经存在该对象？（注意：集合中不允许存在重复的元素）
也许大多数人都会想到调用 equals 方法类逐个去比较，这个方法确实可行。但是如果集合中已经存在一万条数据或者更多的数据，如果采用equals 方法去逐一比较，效率必然
是一个问题。此时hashCode方法的作用就体现出来了，当集合要添加新对象的时候，先调用这个对象的hashCode方法，得到对应的hashCode值，实际上在HashMap的具体实现
中会用一个table保存已经存进去的对象的hashCode值，如果table中没有该hashCode值，他就可以直接存进去，不用再进行任何比较了；如果存在该hashCode值，就调用他的
equals方法与新元素进行比较，相同的话就不存了，不同就散列其他的地址，所以这里存在一个冲突解决的办法，这样一来实际调用equals方法的次数就大大降低了，说通俗点：
Java中的hashCode方法就是根据一定的规则将与对象相关的信息（比如对象存储的地址，对象的字段等）映射成一个值，这个数值称为散列值。
下面这段代码就是Java.util.HashMap的put方法的具体实现：
public V put(K paramK, V paramV)
{
if (paramK == null) {
return putForNullKey(paramV);
}
int i = hash(paramK);
int j = indexFor(i, this.table.length);
for (Entry localEntry = this.table[j]; localEntry != null; localEntry = localEntry.next)
{
Object localObject1;
if ((localEntry.hash == i) && (((localObject1 = localEntry.key) == paramK) || (paramK.equals(localObject1))))
{
Object localObject2 = localEntry.value;
localEntry.value = paramV;
localEntry.recordAccess(this);
return localObject2;
}
}
this.modCount += 1;
addEntry(i, paramK, paramV, j);
return null;
}

put方法是用来向HashMap中添加新元素的，从put方法的具体实现可知：会先调用hashCode方法得到该元素的hashCode值，然后查看table中是否有该hashCode值，如果
存在则调用equals方法重新确定是否存在该元素，如果存在，则更新value，否则将新的元素添加到HashMap中。从这里可以看出，hashCode方法的存在是为了减少equals
方法的调用次数，从而提高效率。
有些朋友误以为默认情况下，hashCode返回的就是对象的存储地址，事实上这种看法是不全面的，确实有些JVM在实现是直接返回对象的存储地址，但大多数并不是这样，
只能说可能与存储地址有一定关联、下面是HotSpot JVM中生成hash散列值的实现：
static inline intptr_t get_next_hash(Thread * Self, oop obj) {
intptr_t value = 0 ;
if (hashCode == 0) {
// This form uses an unguarded global Park-Miller RNG,
// so it's possible for two threads to race and generate the same RNG.
// On MP system we'll have lots of RW access to a global, so the
// mechanism induces lots of coherency traffic.
value = os::random() ;
} else
if (hashCode == 1) {
// This variation has the property of being stable (idempotent)
// between STW operations. This can be useful in some of the 1-0
// synchronization schemes.
intptr_t addrBits = intptr_t(obj) >> 3 ;
value = addrBits ^ (addrBits >> 5) ^ GVars.stwRandom ;
} else
if (hashCode == 2) {
value = 1 ; // for sensitivity testing
} else
if (hashCode == 3) {
value = ++GVars.hcSequence ;
} else
if (hashCode == 4) {
value = intptr_t(obj) ;
} else {
// Marsaglia's xor-shift scheme with thread-specific state
// This is probably the best overall implementation -- we'll
// likely make this the default in future releases.
unsigned t = Self->_hashStateX ;
t ^= (t << 11) ;
Self->_hashStateX = Self->_hashStateY ;
Self->_hashStateY = Self->_hashStateZ ;
Self->_hashStateZ = Self->_hashStateW ;
unsigned v = Self->_hashStateW ;
v = (v ^ (v >> 19)) ^ (t ^ (t >> 8)) ;
Self->_hashStateW = v ;
value = v ;
}

value &= markOopDesc::hash_mask;
if (value == 0) value = 0xBAD ;
assert (value != markOopDesc::no_hash, "invariant") ;
TEVENT (hashCode: GENERATE) ;
return value;
}

该实现位于 hotspot\src\share\vm\runtime\synchronizer.cpp文件下。
因此有人会说，可以直接根据hashCode值判断俩个对象相等吗？肯定不可以。因为不同的对象可能会生成相同的hashCode值。虽然不能根据hashCode值判断俩个对象
a035
是否
相等，但是可以直接根据hashCode值判断俩个对象不等，如果俩个对象的hashCode值不等，则必定是俩个不同对象，如果要判断俩个对象是否相等，必须通过equals 方法。
也就是说，如果俩个对象调用equals方法得到的结果为true，则俩个对象的hashCode值必定相等；
如果equals 方法得到的结果为false，则俩个对象的hashCode值不一定相等；
如果俩个对象的hashCode值不等，则equals 方法得到的结果必定为false；
如果俩个对象的hashCode值相等；则equals 方法得到的结果未知。

未完。。。。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航

添加评论
分享网址
分享文章
返回顶部