您的位置:首页 > 编程语言 > Java开发

Java 中的 hashcode一

2016-04-07 22:10 429 查看
  哈希表这个数据结构我们都很清楚,而且在很多地方都会利用hash表来提高查询效率。在Java的Object类中有一个方法:
public native int hashCode();

  根据这个方法的声明可知:该方法返回一个int 类型的值,并且是本地方法。
  为什么在Object中会有这样一个方法,他有什么作用?

一、hashcode方法的作用

   对于包含容器类型的程序设计语言,基本上都会涉及到hashCode。在Java中也一样,hashCode方法的作用是为了配合基于散列的集合一起正常运行,这样的散列集合包括HashSet、HashMap和Hashtable。
  为什么这么说?考虑一种情况,当向集合中插入对象的时候,如何判断在集合中是否已经存在该对象?(注意:集合中不允许存在重复的元素)
  也许大多数人都会想到调用 equals 方法类逐个去比较,这个方法确实可行。但是如果集合中已经存在一万条数据或者更多的数据,如果采用equals 方法去逐一比较,效率必然
是一个问题。此时hashCode方法的作用就体现出来了,当集合要添加新对象的时候,先调用这个对象的hashCode方法,得到对应的hashCode值,实际上在HashMap的具体实现
中会用一个table保存已经存进去的对象的hashCode值,如果table中没有该hashCode值,他就可以直接存进去,不用再进行任何比较了;如果存在该hashCode值,就调用他的
equals方法与新元素进行比较,相同的话就不存了,不同就散列其他的地址,所以这里存在一个冲突解决的办法,这样一来实际调用equals方法的次数就大大降低了,说通俗点:
Java中的hashCode方法就是根据一定的规则将与对象相关的信息(比如对象存储的地址,对象的字段等)映射成一个值,这个数值称为散列值。
  下面这段代码就是Java.util.HashMap的put方法的具体实现:
public V put(K paramK, V paramV)
{
if (paramK == null) {
return putForNullKey(paramV);
}
int i = hash(paramK);
int j = indexFor(i, this.table.length);
for (Entry localEntry = this.table[j]; localEntry != null; localEntry = localEntry.next)
{
Object localObject1;
if ((localEntry.hash == i) && (((localObject1 = localEntry.key) == paramK) || (paramK.equals(localObject1))))
{
Object localObject2 = localEntry.value;
localEntry.value = paramV;
localEntry.recordAccess(this);
return localObject2;
}
}
this.modCount += 1;
addEntry(i, paramK, paramV, j);
return null;
}

  put方法是用来向HashMap中添加新元素的,从put方法的具体实现可知:会先调用hashCode方法得到该元素的hashCode值,然后查看table中是否有该hashCode值,如果
存在则调用equals方法重新确定是否存在该元素,如果存在,则更新value,否则将新的元素添加到HashMap中。从这里可以看出,hashCode方法的存在是为了减少equals
方法的调用次数,从而提高效率。
  有些朋友误以为默认情况下,hashCode返回的就是对象的存储地址,事实上这种看法是不全面的,确实有些JVM在实现是直接返回对象的存储地址,但大多数并不是这样,
只能说可能与存储地址有一定关联、下面是HotSpot JVM中生成hash散列值的实现:
static inline intptr_t get_next_hash(Thread * Self, oop obj) {
intptr_t value = 0 ;
if (hashCode == 0) {
// This form uses an unguarded global Park-Miller RNG,
// so it's possible for two threads to race and generate the same RNG.
// On MP system we'll have lots of RW access to a global, so the
// mechanism induces lots of coherency traffic.
value = os::random() ;
} else
if (hashCode == 1) {
// This variation has the property of being stable (idempotent)
// between STW operations. This can be useful in some of the 1-0
// synchronization schemes.
intptr_t addrBits = intptr_t(obj) >> 3 ;
value = addrBits ^ (addrBits >> 5) ^ GVars.stwRandom ;
} else
if (hashCode == 2) {
value = 1 ; // for sensitivity testing
} else
if (hashCode == 3) {
value = ++GVars.hcSequence ;
} else
if (hashCode == 4) {
value = intptr_t(obj) ;
} else {
// Marsaglia's xor-shift scheme with thread-specific state
// This is probably the best overall implementation -- we'll
// likely make this the default in future releases.
unsigned t = Self->_hashStateX ;
t ^= (t << 11) ;
Self->_hashStateX = Self->_hashStateY ;
Self->_hashStateY = Self->_hashStateZ ;
Self->_hashStateZ = Self->_hashStateW ;
unsigned v = Self->_hashStateW ;
v = (v ^ (v >> 19)) ^ (t ^ (t >> 8)) ;
Self->_hashStateW = v ;
value = v ;
}

value &= markOopDesc::hash_mask;
if (value == 0) value = 0xBAD ;
assert (value != markOopDesc::no_hash, "invariant") ;
TEVENT (hashCode: GENERATE) ;
return value;
}


  该实现位于 hotspot\src\share\vm\runtime\synchronizer.cpp文件下。
  因此有人会说,可以直接根据hashCode值判断俩个对象相等吗?肯定不可以。因为不同的对象可能会生成相同的hashCode值。虽然不能根据hashCode值判断俩个对象
a035
是否
相等,但是可以直接根据hashCode值判断俩个对象不等,如果俩个对象的hashCode值不等,则必定是俩个不同对象,如果要判断俩个对象是否相等,必须通过equals 方法。
  也就是说,如果俩个对象调用equals方法得到的结果为true,则俩个对象的hashCode值必定相等;
  如果equals 方法得到的结果为false,则俩个对象的hashCode值不一定相等;
  如果俩个对象的hashCode值不等,则equals 方法得到的结果必定为false;
  如果俩个对象的hashCode值相等;则equals 方法得到的结果未知。

未完。。。。

 


内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: