您的位置：首页 > 编程语言 > Java开发

Hashmap与Trove4j

2013-11-03 16:15 323 查看

HashMap 的实例有两个参数影响其性能：初始容量和加载因子。容量是哈希表中桶的数量，初始容量只是哈希表在创建时的容量。加载因子是哈希表在其容量自动增加之前可以达到多满的一种尺度。当哈希表中的条目数超出了加载因子与当前容量的乘积时，则要对该哈希表进行rehash
操作（即重建内部数据结构），从而哈希表将具有大约两倍的桶数。

通常，默认加载因子 (0.75) 在时间和空间成本上寻求一种折衷。加载因子过高虽然减少了空间开销，但同时也增加了查询成本（在大多数HashMap 类的操作中，包括
get 和 put 操作，都反映了这一点）。在设置初始容量时应该考虑到映射中所需的条目数及其加载因子，以便最大限度地减少 rehash 操作次数。如果初始容量大于最大条目数除以加载因子，则不会发生 rehash 操作。如果很多映射关系要存储在HashMap 实例中，则相对于按需执行自动的 rehash 操作以增大表的容量来说，使用足够大的初始容量创建它将使得映射关系能更有效地存储。

常用的解决hash冲突的方法：开放寻址（open addressing）和拉链法（chaining）。当多个不同的key被映射到相同的slot时，chaining方式采用链表保存所有的value。而Open addressing则尝试在该slot的邻近位置查找，直到找到对应的value或者空闲的slot，
这个过程被称作probing。常见的probing策略有Linear probing，Quadratic probing和Double hashing。

GNU Trove (http://trove4j.sourceforge.net/) 是一个Java 集合类库。在某些场景下，Trove集合类库提供了更好的性能，而且内存使用更少。以下是Trove中跟open addressing相关的几个特性：
Trove maps/sets没有使用chaining解决hash冲突，而是使用了open addressing。
跟chaining相比，open addressing对hash算法的要求更高。通过TObjectHashingStrategy 接口， Trove支持定制hash算法（例如不希望使用String或者数组的默认hash算法）。
Trove提供的maps/sets的capaicity属性一定是质数，这有助于减少hash冲突。
跟java.util.HashSet不同，Trove sets没有使用maps，因此不需要额外分配value的引用。

跟java.util.HashMap相比，gnu.trove.THashMap没有Entry[] table之类的成员变量，而是分别通过Object[] _set，V[] _values直接保存key和value。在逻辑上，Object[] _set中的每个元素都有三种状态：
FREE：该slot目前空闲；
REMOVED：该slot之前被使用过，但是目前数据已被移除；
OCCUPIED：该slot目前被使用中；
参考文章：http://hi.baidu.com/you_just_do_it/item/0a383d732727c81dd0dcb3a4

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： java hashmap trove 内存优化

相关文章推荐

新的分享

章节导航