您的位置：首页 > 其它
HashMap源码解析

2016-03-02 00:00 435 查看
摘要: hashmap的源码解析，全部是自己啃完后的理解，如有不正确的地方还望批评指正
public class HashMap<K,V>
extends AbstractMap<K,V>
implements Map<K,V>, Cloneable, Serializable
{

//默认初始化大小，如果没有给初始化值的话，大小就是16（2的n次幂），后面的扩容也是2的N次幂
static final int DEFAULT_INITIAL_CAPACITY = 16;

//最大容量，2的30次方
static final int MAXIMUM_CAPACITY = 1 << 30;

//系统默认的负载因子（没懂其意义）
static final float DEFAULT_LOAD_FACTOR = 0.75f;

//存放数据的实体（重要）
transient Entry[] table;

//实际存放数据的量
transient int size;

//阈值（没懂）,大小为Entry的长度*loadFactor
int threshold;

//哈希表的负载因子（没懂）
final float loadFactor;

//修改次数
transient volatile int modCount;

//构建函数（初始化容量和hash表的负载）
public HashMap(int initialCapacity, float loadFactor) {
if (initialCapacity < 0)//小于零抛异常
throw new IllegalArgumentException("Illegal initial capacity: " +
initialCapacity);
//保证Entry[]的大小不会超过最大值
if (initialCapacity > MAXIMUM_CAPACITY)
initialCapacity = MAXIMUM_CAPACITY;
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal load factor: " +
loadFactor);

// 初始化各个值，除非initialCapacity刚好是2的N次幂，否则初始化Entry[]的容量肯定比传入的initialCapa        //city值要大，并且应该是比initialCapacity大的第一个2的N次幂
int capacity = 1;
while (capacity < initialCapacity)
capacity <<= 1;

this.loadFactor = loadFactor;
threshold = (int)(capacity * loadFactor);
table = new Entry[capacity];
init();
}

//构造函数
public HashMap(int initialCapacity) {
this(initialCapacity, DEFAULT_LOAD_FACTOR);
}

//构造函数
public HashMap() {
this.loadFactor = DEFAULT_LOAD_FACTOR;
threshold = (int)(DEFAULT_INITIAL_CAPACITY * DEFAULT_LOAD_FACTOR);
table = new Entry[DEFAULT_INITIAL_CAPACITY];
init();
}

//构造函数
public HashMap(Map<? extends K, ? extends V> m) {
//初始化新map的大小等参数
this(Math.max((int) (m.size() / DEFAULT_LOAD_FACTOR) + 1,
DEFAULT_INITIAL_CAPACITY), DEFAULT_LOAD_FACTOR);
//copy数据，把m中的数据复制到新的集合里面，putAllForCreate的细节在方法内解析
putAllForCreate(m);
}

void init() {
}

//一个自定义的hash算法
static int hash(int h) {
h ^= (h >>> 20) ^ (h >>> 12);
return h ^ (h >>> 7) ^ (h >>> 4);
}

//自定义的算法，返回的结果就是在Entry[]数组中的位置
static int indexFor(int h, int length) {
return h & (length-1);
}

//返回具体数据的数量
public int size() {
return size;
}

//判断是否为空
public boolean isEmpty() {
return size == 0;
}

//获取数据
public V get(Object key) {
//key==null的话就找寻是否有key为空值对应的value
if (key == null)
return getForNullKey();
int hash = hash(key.hashCode());
//这个for循环挺有意思，由于hashmap是数组+链表，所以此循环实际上是找到在Entry[]上的位置，然后循环这个        //位置上的链表，很像XY轴，定位到X轴后再循环在X轴上Y轴的数据
for (Entry<K,V> e = table[indexFor(hash, table.length)];
e != null;
e = e.next) {
Object k;
//e内存储的hash要和传入的key的hash值相同（e内存储的hash就是e中key的hash值），并且e中的key要和             //传入的key相等，此时返回e的value
if (e.hash == hash && ((k = e.key) == key || key.equals(k)))
return e.value;
}
//否则为空
return null;
}

//返回空键的值，按照之前的算法，传入的key为空的时候，由于存放数值的函数处理的时候把key为空时放到0处，所以    //搜寻地址在0处的链表就行了
private V getForNullKey() {
for (Entry<K,V> e = table[0]; e != null; e = e.next) {
if (e.key == null)
return e.value;
}
return null;
}

//看是否有哪个Entry内的key等于传入的key，有的话为true，否则为false
public boolean containsKey(Object key) {
return getEntry(key) != null;
}

//获取key对应的Entry
final Entry<K,V> getEntry(Object key) {
//key为空的时候直接给0，否则计算会抛空指针异常
int hash = (key == null) ? 0 : hash(key.hashCode());
//遍历整个链表
for (Entry<K,V> e = table[indexFor(hash, table.length)];
e != null;
e = e.next) {
Object k;
//e的key与传入的相等就返回此Entry
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
return e;
}
//否则为空
return null;
}

//存入数据
public V put(K key, V value) {
//key为空的时候特殊处理
if (key == null)
return putForNullKey(value);
//计算key的hash值
int hash = hash(key.hashCode());
//通过key定位到数组的位置
int i = indexFor(hash, table.length);
//遍历i上的链表
for (Entry<K,V> e = table[i]; e != null; e = e.next) {
Object k;
//如果找到有一样的（同一个key），就替换此处的值，只替换此处Entry内的value属性值
if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
V oldValue = e.value;
e.value = value;
//不知道干啥的
e.recordAccess(this);
//返回以前的value  PS：有些API手册上没注明会返回原来的值
return oldValue;
}
}
//修改次数+1
modCount++;
//发现Entry[]的i位置上的链表没有同样的key，就在i上添加值，具体的添加细节看下面的方法注释
addEntry(hash, key, value, i);
//然后返回NULL
return null;
}

//key为空的时候存放value
private V putForNullKey(V value) {
//遍历Entry[]0处的链表
for (Entry<K,V> e = table[0]; e != null; e = e.next) {
//功能同上个方法
if (e.key == null) {
V oldValue = e.value;
e.value = value;
e.recordAccess(this);
return oldValue;
}
}
//同上，0处没发现有等于null的key就添加一个值
modCount++;
addEntry(0, null, value, 0);
return null;
}

//最后一个构造函数new Map(map)的业务方法
private void putForCreate(K key, V value) {
//若key为空仍然用0，否则就计算出hash值
int hash = (key == null) ? 0 : hash(key.hashCode());
//在Entry[]上的位置
int i = indexFor(hash, table.length);
//遍历此位置上的链表
for (Entry<K,V> e = table[i]; e != null; e = e.next) {
Object k;
//替换value
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k)))) {
e.value = value;
return;
}
}
//没找到一样的key就创建一个Entry
createEntry(hash, key, value, i);
}

//第四个构造函数直接调用的方法
private void putAllForCreate(Map<? extends K, ? extends V> m) {
//用迭代器（感觉可以用while(i.hasNext())），遍历m内的所有元素
for (Iterator<? extends Map.Entry<? extends K, ? extends V>> i = m.entrySet().iterator(); i.hasNext(); ) {
Map.Entry<? extends K, ? extends V> e = i.next();
//把每个迭代的值用以下方法处理，具体看下面方法的注释
putForCreate(e.getKey(), e.getValue());
}
}

//重新修改map的大小
void resize(int newCapacity) {
//将当前的Entry[]拿出来
Entry[] oldTable = table;
//旧数组的长度（数组的长度，不是数值的数量）
int oldCapacity = oldTable.length;
//若就数组的长度是最大值
if (oldCapacity == MAXIMUM_CAPACITY) {
//修改临界值
threshold = Integer.MAX_VALUE;
return;
}
//用新的传入长度构建一个Entry[]
Entry[] newTable = new Entry[newCapacity];
//复制，把原来Entry[]内的数据都复制到新的Entry[]内
transfer(newTable);
//替换掉旧的数组
table = newTable;
//修改阈值
threshold = (int)(newCapacity * loadFactor);
}

//复制，把原来Entry[]内的数据都复制到新的Entry[]内
void transfer(Entry[] newTable) {
//把当前数组（旧数组）“存盘”
Entry[] src = table;
//新数组的长度
int newCapacity = newTable.length;
//遍历旧的数组
for (int j = 0; j < src.length; j++) {
//旧数组的数据“存盘”
Entry<K,V> e = src[j];
if (e != null) {
//清空位置为j上的所有数据
src[j] = null;
//开始循环之前j位置上的链表
do {
//这个循环有点意思，文字表述有点困难，后续补图
//首先Entry是个链表，它内部的next指向另一个Entry
//理解以上的东西后，以下循环以这个链表上的第一个数据为例：
//先把链表从第二个值开始的链表（当前循环值的后一个）“存盘”(1)，然后在新的数组上计算出此链表                 //上第一个值应该存放的位置i(2),然后把这个数组i上的数据拼接到此链表第一个数据之后，形成一个新                //的链表（3），再把拼接后的链表放到数组的i处（4），然后把从第二个值开始的链表赋给e（5）,接下                //来就是继续循环,知道e==null为止（6）。然后再循环此数组上的下一个链表
Entry<K,V> next = e.next;  //1
int i = indexFor(e.hash, newCapacity);//2
e.next = newTable[i];//3
newTable[i] = e;//4
e = next;//5
} while (e != null);//6
}
//copy完之后数据的位置是有变化的，先不说在新数组上的位置变了，连在链表上的位置也变了
//整体的调整容量思路就是:创建一个具有新容量的数组,然后把旧数组的值全部复制到新的数组里面，同时清             //空旧数组的值（消除指针），等待回收
}
}

//把m的值copy到原来的数组内，如果key相同就替换掉原来的value，如果key不同则加入
public void putAll(Map<? extends K, ? extends V> m) {
int numKeysToBeAdded = m.size();
//传入的m为空，就返回空
if (numKeysToBeAdded == 0)
return;

//如果m的size大于当前的阈值，则通过计算扩大后的m.size()会不会比table.length大，如果大则执行后续操作
//ps：小小的计算了一下，发现只要m.size>阈值，newCapacity < targetCapacity就几乎是恒成立的
//大概就是4/3*m.size<table.length<4/3*m.size+1，在这种情况下newCapacity 才可能大于targetCapacity
if (numKeysToBeAdded > threshold) {
int targetCapacity = (int)(numKeysToBeAdded / loadFactor + 1);
if (targetCapacity > MAXIMUM_CAPACITY)
targetCapacity = MAXIMUM_CAPACITY;
int newCapacity = table.length;
while (newCapacity < targetCapacity)
//给原来的table.length扩容
newCapacity <<= 1;
if (newCapacity > table.length)
//调整容量的大小
resize(newCapacity);
}
//开始迭代
for (Iterator<? extends Map.Entry<? extends K, ? extends V>> i = m.entrySet().iterator(); i.hasNext(); ) {
Map.Entry<? extends K, ? extends V> e = i.next();
//把迭代的值扔进原来的put中,执行结果很像jquery的深拷贝(有就替换，没有就添加)
put(e.getKey(), e.getValue());
}
}

//移除Entry[]上e.key=key的Entry,并返回此Entry处的value
public V remove(Object key) {
Entry<K,V> e = removeEntryForKey(key);
return (e == null ? null : e.value);
}

//按照Key移除的业务方法
final Entry<K,V> removeEntryForKey(Object key) {
//key为空hash直接给0
int hash = (key == null) ? 0 : hash(key.hashCode());
//数组的地址
int i = indexFor(hash, table.length);
//存几个盘
Entry<K,V> prev = table[i];
Entry<K,V> e = prev;

//开始循环i处的链表，先不看if语句，先理解这个循环，其实很简单，设两个指针，以e为标准，prev一直是e的         //前一个指针，循环一轮这俩指针就往后移动一格
while (e != null) {
Entry<K,V> next = e.next;
Object k;
//找到对应的值
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k)))) {
//修改次数+1
modCount++;
//数量-1
size--;
//如果e==prev（这种情况只会是删除i处的链表的第一个值）,就把链表上的第二个值放到第一个上
if (prev == e)
table[i] = next;
else
//否则的话，就把prev指向下一个数据的指针移到第三个值身上（跳过第二个值e）
prev.next = next;
e.recordRemoval(this);
//返回这个Entry
return e;
}
向后移动指针
prev = e;
e = next;
}

return e;
}

//同上，只不过此时传入的是Object对象，还要判断一下，如果此对象不是Entry格式的，就返回空
final Entry<K,V> removeMapping(Object o) {
if (!(o instanceof Map.Entry))
return null;

Map.Entry<K,V> entry = (Map.Entry<K,V>) o;
Object key = entry.getKey();
int hash = (key == null) ? 0 : hash(key.hashCode());
int i = indexFor(hash, table.length);
Entry<K,V> prev = table[i];
Entry<K,V> e = prev;

while (e != null) {
Entry<K,V> next = e.next;
if (e.hash == hash && e.equals(entry)) {
modCount++;
size--;
if (prev == e)
table[i] = next;
else
prev.next = next;
e.recordRemoval(this);
return e;
}
prev = e;
e = next;
}

return e;
}

//清仓
public void clear() {
modCount++;
Entry[] tab = table;
for (int i = 0; i < tab.length; i++)
tab[i] = null;
size = 0;
}

//找找是不有这个value这个值
public boolean containsValue(Object value) {
//等于空时特殊处理
if (value == null)
return containsNullValue();
//遍历数组的每个值
Entry[] tab = table;
for (int i = 0; i < tab.length ; i++)
//遍历每个链表上的每个值
for (Entry e = tab[i] ; e != null ; e = e.next)
if (value.equals(e.value))
return true;
return false;
}

//跟上面一样，只不过专门找寻value为空的value，然后返回boolen值
private boolean containsNullValue() {
Entry[] tab = table;
for (int i = 0; i < tab.length ; i++)
for (Entry e = tab[i] ; e != null ; e = e.next)
if (e.value == null)
return true;
return false;
}

//返回一个hashmap对象，这个对象本身是新的，内部的Entry[]数组也是新的，但是，key和value是引用过来的
//实际上，putAllForCreate（this）这个方法也是引用各变量的地址，内部属性并没有在堆内存中开辟新的空间
public Object clone() {
HashMap<K,V> result = null;
try {
//在内存中开辟空间，用于存放一个新的hashmap
result = (HashMap<K,V>)super.clone();
} catch (CloneNotSupportedException e) {

}
//初始化长度等各种属性
result.table = new Entry[table.length];
result.entrySet = null;
result.modCount = 0;
result.size = 0;
result.init();
//this指当前的Hashmap,就是旧的hashmap，此方法上面有注释，只是把key,value,hash和i存入新的hashmap内
result.putAllForCreate(this);

return result;
}

//这就是Entry的真面目，内部类，也叫桶，我觉得叫链条更有意思 - -||
static class Entry<K,V> implements Map.Entry<K,V> {
final K key;
V value;
//就是因为每个桶里都有另一个桶，相当于指向（其实就是指向），另一个桶，这样就把整个链条穿起来
Entry<K,V> next;
final int hash;

//构造方法
Entry(int h, K k, V v, Entry<K,V> n) {
value = v;
next = n;
key = k;
hash = h;
}

//没啥说的
public final K getKey() {
return key;
}

//没啥说的
public final V getValue() {
return value;
}

//没啥说的
public final V setValue(V newValue) {
V oldValue = value;
value = newValue;
return oldValue;
}

//自定义equels方法
public final boolean equals(Object o) {
//判断类型
if (!(o instanceof Map.Entry))
return false;
//强转一个
Map.Entry e = (Map.Entry)o;
//当前key
Object k1 = getKey();
//传入的key
Object k2 = e.getKey();
//判断key和value是否相同，此处要求内存地址或者内容相同
if (k1 == k2 || (k1 != null && k1.equals(k2))) {
Object v1 = getValue();
Object v2 = e.getValue();
if (v1 == v2 || (v1 != null && v1.equals(v2)))
return true;
}
return false;
}

//重写hashcode方法，为了equals准备
public final int hashCode() {
return (key==null   ? 0 : key.hashCode()) ^
(value==null ? 0 : value.hashCode());
}

//没啥说的
public final String toString() {
return getKey() + "=" + getValue();
}

//没啥说的，没懂有什么用
void recordAccess(HashMap<K,V> m) {
}

void recordRemoval(HashMap<K,V> m) {
}
}

//创建新的桶
void addEntry(int hash, K key, V value, int bucketIndex) {
//原来bucketIndex处的链表存盘
Entry<K,V> e = table[bucketIndex];
//创建新的桶，然后把之前的链表连接到新的桶上，形成新的链表
table[bucketIndex] = new Entry<K,V>(hash, key, value, e);
//数据量超过阈值之后就扩大table.length，然后要重新计算阈值，老规矩还是大于等于2 * table.length的第        //一个2的n次幂*3/4
if (size++ >= threshold)
resize(2 * table.length);
}

//创建新的桶，和上个方法差不多，只是不用扩大阈值，因为调用这个方法的方法都知道，创建的桶是不会超过阈值的
void createEntry(int hash, K key, V value, int bucketIndex) {
Entry<K,V> e = table[bucketIndex];
table[bucketIndex] = new Entry<K,V>(hash, key, value, e);
size++;
}

//实现迭代器
private abstract class HashIterator<E> implements Iterator<E> {
Entry<K,V> next;   //下一个值
int expectedModCount;  // 用来存储改变的次数
int index;    //当前指针
Entry<K,V> current;    //当前值

//构造方法
HashIterator() {
//存储修改次数
expectedModCount = modCount;
if (size > 0) { // advance to first entry
Entry[] t = table;
//看起来是用来循环数组上的每一个链表，但是不知道为什么在构造器里这样写
while (index < t.length && (next = t[index++]) == null)
;
}
}

//常用迭代器判断方法
public final boolean hasNext() {
return next != null;
}

//返回迭代的下一个桶的值
final Entry<K,V> nextEntry() {
if (modCount != expectedModCount)
throw new ConcurrentModificationException();
//next赋给一个新的桶（next在构造器里被赋值过）
Entry<K,V> e = next;
if (e == null)
throw new NoSuchElementException();
//next的指针往后移一个单位，并判断这个链表是否到最后一个值
if ((next = e.next) == null) {
//如果是最后一个值，则index指向下一个数组的位置，next则指向下一个数组的第一个桶
Entry[] t = table;
while (index < t.length && (next = t[index++]) == null)
;
}
//e赋给当前值
current = e;
//返回当前值
return e;
}

//移除当前值
public void remove() {
if (current == null)
throw new IllegalStateException();
if (modCount != expectedModCount)
throw new ConcurrentModificationException();
Object k = current.key;
current = null;
HashMap.this.removeEntryForKey(k);
expectedModCount = modCount;
}

}

//把以上的类当父类继承，next()只返回value
private final class ValueIterator extends HashIterator<V> {
public V next() {
return nextEntry().value;
}
}

//同样继承，但是只返回桶的key
private final class KeyIterator extends HashIterator<K> {
public K next() {
return nextEntry().getKey();
}
}

//返回桶
private final class EntryIterator extends HashIterator<Map.Entry<K,V>> {
public Map.Entry<K,V> next() {
return nextEntry();
}
}

//没加访问权限符，默认是friendly，只有同类和同包中的类才能访问
Iterator<K> newKeyIterator()   {
return new KeyIterator();
}
Iterator<V> newValueIterator()   {
return new ValueIterator();
}
Iterator<Map.Entry<K,V>> newEntryIterator()   {
return new EntryIterator();
}

//生命一个Set
private transient Set<Map.Entry<K,V>> entrySet = null;

//赋值ks一个new KeySet()
public Set<K> keySet() {
Set<K> ks = keySet;
return (ks != null ? ks : (keySet = new KeySet()));
}

//继承抽象Set，一个Set的视图
private final class KeySet extends AbstractSet<K> {
//实现接口的方法，返回之前写好的方法，返回桶的key
public Iterator<K> iterator() {
return newKeyIterator();
}
//下面全是重写
public int size() {
return size;
}
public boolean contains(Object o) {
return containsKey(o);
}
public boolean remove(Object o) {
return HashMap.this.removeEntryForKey(o) != null;
}
public void clear() {
HashMap.this.clear();
}
}

//把桶的value转化成为Collection类型，返回Collection类型的视图
public Collection<V> values() {
Collection<V> vs = values;
return (vs != null ? vs : (values = new Values()));
}

//定义一个类，实现AbstractCollection接口，相当于创建一个AbstractCollection类型的类
private final class Values extends AbstractCollection<V> {
public Iterator<V> iterator() {
return newValueIterator();
}
public int size() {
return size;
}
public boolean contains(Object o) {
return containsValue(o);
}
public void clear() {
HashMap.this.clear();
}
}

//返回一个entrySet
public Set<Map.Entry<K,V>> entrySet() {
return entrySet0();
}

//entrySet的视图
private Set<Map.Entry<K,V>> entrySet0() {
Set<Map.Entry<K,V>> es = entrySet;
return es != null ? es : (entrySet = new EntrySet());
}

//其实和keySet是一样的，只不过这里的迭代器中的next方法返回的是entry，keyset中的迭代器方法返回的是key
private final class EntrySet extends AbstractSet<Map.Entry<K,V>> {
public Iterator<Map.Entry<K,V>> iterator() {
return newEntryIterator();
}
public boolean contains(Object o) {
if (!(o instanceof Map.Entry))
return false;
Map.Entry<K,V> e = (Map.Entry<K,V>) o;
Entry<K,V> candidate = getEntry(e.getKey());
return candidate != null && candidate.equals(e);
}
public boolean remove(Object o) {
return removeMapping(o) != null;
}
public int size() {
return size;
}
public void clear() {
HashMap.this.clear();
}
}

//不懂
private void writeObject(java.io.ObjectOutputStream s)
throws IOException
{
Iterator<Map.Entry<K,V>> i =
(size > 0) ? entrySet0().iterator() : null;

s.defaultWriteObject();

s.writeInt(table.length);

s.writeInt(size);

if (i != null) {
while (i.hasNext()) {
Map.Entry<K,V> e = i.next();
s.writeObject(e.getKey());
s.writeObject(e.getValue());
}
}
}

private static final long serialVersionUID = 362498820763181265L;

private void readObject(java.io.ObjectInputStream s)
throws IOException, ClassNotFoundException
{

s.defaultReadObject();

int numBuckets = s.readInt();
table = new Entry[numBuckets];

init();

int size = s.readInt();

for (int i=0; i<size; i++) {
K key = (K) s.readObject();
V value = (V) s.readObject();
putForCreate(key, value);
}
}

// These methods are used when serializing HashSets
int   capacity()     { return table.length; }
float loadFactor()   { return loadFactor;   }
}
最后一段迭代器解释的不是很清楚，可以逆向来想，collection和set接口都有定义这些类的方法、入参和返回参数，那如果要返回这些类型的对象，就需要一个类去实现这些接口，然后被返回。而这些接口中都有定义迭代器的方法，那就需要返回一个迭代器的对象，此时就写一个HashIterator抽象类，并实现Iterator接口，但又由于需求的不同（有些要返回value，有些要返回key，有些又要返回entry），所以就定义为抽象类，这样就不用实现Iterator下的所有方法，下面再写三个类，继承HashIterator，并实现next()方法，用来返回不同的需求值。然后我们在定义一个方法，用来返回刚才编写的类的对象，将此方法放入collection和set的实现类的Iterator方法中，这样就返回了相应的视图

PS:不是太了解为什么要多加一个方法去返回三个迭代器对象，目测应该是出于访问权限的关系，可能其他的类中也需要调用到这个方法，所以设置成friendly（没加访问权限符，默认为friendly）。
内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理
标签： HashMap源码 HashMap源码分析 HashMap源码详细分解
相关文章推荐
新的分享
章节导航