您的位置:首页 > 编程语言

24、HashSet与HashMap源代码分析

2012-12-29 18:20 393 查看
1、HashSet底层是使用HashMap实现的。当使用add方法将对象添加到set当中时,实际上是将该对象作为底层所维护的Map对象的Key,,而value则都是同一个Object对象(该对象我们用不上);

HashSet部分源代码:

private transient HashMap<E,Object> map;
public HashSet() {
map = new HashMap<E,Object>();
}
public boolean add(E e) {
return map.put(e, PRESENT)==null;
}


HashSet的默认构造方法是生成一个HashMap对象,赋给变量map,HashSet的add()方法是向生成的HashMap中放入一个键值对,这个键值对的键key就是我们要存入HashSet的数据,值value是一个常量PRESENT,这个PRESENT是这样定义的:

private static final Object PRESENT = new Object();


其他方法的定义:

public boolean remove(Object o) {
return map.remove(o)==PRESENT;
}

public void clear() {
map.clear();
}

public boolean isEmpty() {
return map.isEmpty();
}

public int size() {
return map.size();
}

public Iterator<E> iterator() {
return map.keySet().iterator();
}

HashSet的底层都是借助于HashMap来实现的。

2、HashMap的源代码分析(这个很复杂)。先看一下最后面的内存映像图,理解HashMap的存储形式。

首先HashMap定义了几个重要的成员变量

static final int DEFAULT_INITIAL_CAPACITY = 16;  //默认初始容量,是一个常量16

static final float DEFAULT_LOAD_FACTOR = 0.75f;  //默认负载因子,常量float 0.75,就是说数组数据达到数组容量75%时,扩展数组

transient Entry[] table;   //用来存放数据的数组,数组元素为Entry类型的。这是存放Map键值对的主体。

int threshold;

transient int size;

final float loadFactor;
 

HashMap底层维护一个数组(Entry[]),我们向HashMap中所放置的对象实际上是存储在该数组中。
再看一下Entry的定义: 
static class Entry<K,V> implements Map.Entry<K,V> {
final K key;
V value;
Entry<K,V> next;
final int hash;

/**
* Creates new entry.
*/
Entry(int h, K k, V v, Entry<K,V> n) {
value = v;
next = n;
key = k;
hash = h;
}

public final K getKey() {
return key;
}

public final V getValue() {
return value;
}

public final V setValue(V newValue) {
V oldValue = value;
value = newValue;
return oldValue;
}

public final boolean equals(Object o) {
if (!(o instanceof Map.Entry))
return false;
Map.Entry e = (Map.Entry)o;
Object k1 = getKey();
Object k2 = e.getKey();
if (k1 == k2 || (k1 != null && k1.equals(k2))) {
Object v1 = getValue();
Object v2 = e.getValue();
if (v1 == v2 || (v1 != null && v1.equals(v2)))
return true;
}
return false;
}

public final int hashCode() {
return (key==null   ? 0 : key.hashCode()) ^
(value==null ? 0 : value.hashCode());
}

public final String toString() {
return getKey() + "=" + getValue();
}

Entry定义了四个成员变量,key和value分别用来存放键值对映射的键和值,这里注意key的定义是final的,也就是说key初始化完毕后就不能改变了,也因此HashMap只提供key的getter方法,value则提供了setter和getter方法。换句话说,如果我的HashMap中保存了“aaa”键和“value1”值这样一个键值对,而我想改成键为“bbb”而值不变依然为“value1”,只能通过先删除aaa键值对,再增加“bbb”键值对,不能直接修改“aaa”这个键。next指向另一个Entry'对象(相当于链表的指针),hash为一个final的int变量,也是只有在初始化时赋值,他是键key的hash值,Entry只有一个带参数的构造方法,所以生成新对象时就确定了key和hash。 
HashMap默认构造方法:

public HashMap() {
this.loadFactor = DEFAULT_LOAD_FACTOR;
threshold = (int)(DEFAULT_INITIAL_CAPACITY * DEFAULT_LOAD_FACTOR);
table = new Entry[DEFAULT_INITIAL_CAPACITY];
init();
}


生成一个默认长度(16)的Entry数组。

往HashMap对象中存放键值对方法put():

public V put(K key, V value) {
if (key == null)
return putForNullKey(value);
int hash = hash(key.hashCode());
int i = indexFor(hash, table.length);
for (Entry<K,V> e = table[i]; e != null; e = e.next) {
Object k;
if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
V oldValue = e.value;
e.value = value;
e.recordAccess(this);
return oldValue;
}
}

modCount++;
addEntry(hash, key, value, i);
return null;
}

对于key==null的键值对,调用了putForNullKey()方法:

private V putForNullKey(V value) {
for (Entry<K,V> e = table[0]; e != null; e = e.next) {
if (e.key == null) {
V oldValue = e.value;
e.value = value;
e.recordAccess(this);
return oldValue;
}
}
modCount++;
addEntry(0, null, value, 0);
return null;
}


从这个方法看,好像是key为null的键值对是固定保存在table[0]的。(这里有疑问)。e.recordAccess()方法不明白意思。最后是调用了addEntry(0, null, value, 0);这个方法(应该就是table[0]处,说明key为null的hash值为0,保存在数组table第一位):

void addEntry(int hash, K key, V value, int bucketIndex) {
Entry<K,V> e = table[bucketIndex];
table[bucketIndex] = new Entry<K,V>(hash, key, value, e);
if (size++ >= threshold)
resize(2 * table.length);
}

这个方法先把bucketIndex处的对象赋值给e(bucketIndex也就是要添加的键值对在table数组的下标,从put方法看,就是i,i = indexFor(hash, table.length);),然后生成一个新的Entry对象,存放在table[bucketIndex]处,而这个新Entry对象的next指向了原来的那个Entry对象,就是e。

put()方法中的for循环用来判断链上是否已经存有相同键(key)的元素,判断是否相等,就是要hash值相等并且((k = e.key) == key || key.equals(k)),如果有相同的键存在,就修改其值,反之就是没有相同的键,那么就执行addEntry()方法,添加新的键值对。

HashMap在内存中的示意映像图:



HashMap底层维护一个数组(Entry[]),我们向HashMap中所放置的对象实际上是存储在该数组中。

当向HashMap中put一对键值时,他会根据key的hashCode值计算出一个位置,该位置就是此对象准备往数组中存放的位置。

如果该位置没有对象存在就将此对象直接放进数组当中;如果该位置已经有对象存在了,则顺着此存在的对象的链开始寻找(Entry类有一个Entry类型的next成员变量,指向了该对象的下一个对象),如果此链上有对象的话,再去使用equals方法进行比较,如果对此链上的某个对象的equals方法比较为false,则将该对象放到数组当中,然后将数组中该位置以前存在的那个对象连接到此对象的后面。

3、Properties类

主要用于一些属性文件,key = value形式

Properties的key和value都是String的

获取环境变量:

import java.util.Iterator;
import java.util.Properties;
import java.util.Set;

public class PropertiesTest
{
public static void main(String[] args)
{
Properties p = System.getProperties();

Set set = p.keySet();

for(Iterator iter = set.iterator();iter.hasNext();)
{
String key = (String)iter.next();
String value = p.getProperty(key);

System.out.println(key + "=" + value);
}
}
}


 
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: