您的位置:首页 > 编程语言 > Java开发

[JDK源码分析] ArrayList底层实现原理

2020-04-19 20:28 393 查看

ArrayList是List接口的动态数组实现,允许存放所有元素,包括null。除了实现List接口外,ArrayList类还提供了操作数组大小的方法。功能与Vector类似,但是不同步。

类定义

public class ArrayList<E> extends AbstractList<E>
implements List<E>, RandomAccess, Cloneable, java.io.Serializable

ArrayList类继承1个抽象类,实现4个实现。

  • Serializable接口:标记接口,表示可序列化。
  • RandomAccess接口:标记接口,表示列表支持快速随机访问,LinkedList则不支持随机访问,没有该接口。
  • Cloneable接口:标记接口,表示可复制。
  • List接口:作为列表规范,规定需要实现的功能,LinkedList同样实现List接口。
  • AbstractList抽象类:提供List接口骨架实现,尽可能较少实现随机访问数据所需的操作。对于连续访问数据(如链表),优先使用AbstractSequentialList,内部主要是迭代器实现。

【扩展】对于随机存储数据和连续访问数据,可以参考Collections.binarySearch()方法的源码。

// Collections
public static <T>
int binarySearch(List<? extends Comparable<? super T>> list, T key) {
if (list instanceof RandomAccess || list.size()<BINARYSEARCH_THRESHOLD)
// for循环遍历实现
return Collections.indexedBinarySearch(list, key);
else
// 迭代器实现
return Collections.iteratorBinarySearch(list, key);
}

性能比较:ArrayList用for循环遍历比iterator迭代器遍历快,LinkedList用iterator迭代器遍历比for循环遍历快!!

类注释解读

ArrayList是List接口的动态数组实现,允许存放所有元素,包括null。除了实现List接口外,ArrayList类还提供了操作数组大小的方法。功能与Vector类似,但是不同步。

时间复杂度:get、set以及迭代器操作时间复杂度是O(1)。add操作以均摊常数时间运行,也就是说,添加n个元素需要O(n)时间。其他操作时间复杂度为O(n),以线性时间运行。与 LinkedList 实现相比,该实现的常数因子更低。

扩容:ArrayList实例的容量capacity是指存储元素的数组大小,总是大于等于列表大小。随着不断添加元素,容量会自动扩展。在添加大量元素之前,ArrayList采用ensureCapcity方法来增加实例容量,有效的减少递增式再分配的数量。

线程安全性:该实现不是同步的。多个线程同时访问一个ArrayList实例,并且存在至少一个线程对列表做结构性修改时,必须进行同步。针对于ArrayList,结构性修改是指任何添加或删除一个或者多个元素,或者显式调整底层数组大小的操作;修改元素值不是结构性修改。一般通过对自然封装该列表的对象进行同步操作来完成,如果不存在这样的对象,应该采用Collections.synchronizedList将当前列表封装起来(最好是在创建时完成,以防意外对列表的不同步访问)。

ArrayList的迭代器操作具有快速失败(Fast-Fail)机制,在创建迭代器后,除非是自身remove或add操作,任何其他对列表的结构性修改,迭代器都会抛出ConcurrentModificationException。

属性与常量

ArrayList架构比较简单,底层就是一个Object数组–elementData。

  • DEFAULT_CAPACITY 表示数组初始容量,默认为10。
  • size表示列表元素个数,没有volitile修饰,线程不安全。
  • modCount是AbstractList抽象类中的字段,用于记录当前数组结构性修改次数。
    【注】elementData是transient修饰的,不被序列化。

其他常量

// 可分配的最大数组大小,由于有些虚拟机会保留位置,分配更大数组会导致OutOfMemoryError
private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

// 共享的空数组实例,用于空实例。
private static final Object[] EMPTY_ELEMENTDATA = {};
// 共享的空数组实例,用于默认大小的空实例。
// 与EMPTY_ELEMENTDATA做区分,以便了解在添加第一个元素时需要扩展多少数组容量。
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};

类初始化

无参构造方法 – 默认容量

public ArrayList() {
this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}

初始化为共享空数组DEFAULTCAPACITY_EMPTY_ELEMENTDATA,添加元素时进行扩容。

指定容量作为参数的构造方法

public ArrayList(int initialCapacity) {
if (initialCapacity > 0) {
this.elementData = new Object[initialCapacity];
} else if (initialCapacity == 0) {
this.elementData = EMPTY_ELEMENTDATA;
} else {
throw new IllegalArgumentException("Illegal Capacity: "+
initialCapacity);
}
}

大于0,创建指定大小的Object数组;等于0,初始化共享空数组EMPTY_ELEMENTDATA;其他抛出参数不合法异常。
指定集合作为参数的构造方法

public ArrayList(Collection<? extends E> c) {
elementData = c.toArray();
if ((size = elementData.length) != 0) {
// 如果c.toArray返回的不是Object[]类型,转为Object
if (elementData.getClass() != Object[].class)
elementData = Arrays.copyOf(elementData, size, Object[].class);
} else {
// 集合元素个数为0,使用空数组代替
this.elementData = EMPTY_ELEMENTDATA;
}
}

需要特别注意的是,ArrayList无参构造初始化时,默认创建空数组,在首次添加元素时才会初始为10。

新增与扩容实现

ArrayList类add(E e)方法,将指定元素添加到列表末尾,时间复杂度为O(1),但考虑到动态数组扩容的性质,添加操作为均摊O(1)。

public boolean add(E e) {
// 判断底层数组容量是否足够,不够则进行扩容
ensureCapacityInternal(size + 1);  // Increments modCount!!
// 直接赋值--线程不安全
elementData[size++] = e;
return true;
}

在源码中,添加元素操作分为了两步:扩容和赋值。

private void ensureCapacityInternal(int minCapacity) {
ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
}

private static int calculateCapacity(Object[] elementData, int minCapacity) {
// 如果底层数组仍为默认空数组,设定为初始值10
if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
return Math.max(DEFAULT_CAPACITY, minCapacity);
}
return minCapacity;
}
private void ensureExplicitCapacity(int minCapacity) {
// 列表结构性修改次数加1
modCount++;

// 如果期望最小容量大于当前数组容量,则扩容
if (minCapacity - elementData.length > 0)
grow(minCapacity);
}

// 扩容操作
private void grow(int minCapacity) {
int oldCapacity = elementData.length;
// 扩容后容量是当前数组容量的1.5倍
int newCapacity = oldCapacity + (oldCapacity >> 1);

// 如果扩容后容量仍然小于期望最小容量,设为期望容量
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;

// 如果扩容后容量大于JVM所能分配数组容量的最大值Integer.MAX_VALUE - 8,则使用Integer的最大值Integer.MAX_VALUE
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);

// 创建新数组,复制原数组所有元素到新数组后,最后指针指向新数组
elementData = Arrays.copyOf(elementData, newCapacity);
}

在新增过程中,

  • 没有对值做校验,因此ArrayList是允许空值的。
  • 数组操作,需要特别注意边界值,例如数组下界不能小于0,上界不能大于Integer.MAX_VALUE。
  • 扩容结束的赋值语句elementData[size++] = e;采用的是直接赋值,没有锁,此处线程不安全。
  • 数组拷贝操作,内部调用System#arraycopy方法,是一个native方法。
public static native void arraycopy(Object src,  int  srcPos,
Object dest, int destPos,
int length);

源码问题:计算最小期望容量方法中,当elementData为DEFAULTCAPACITY_EMPTY_ELEMENTDATA时,应该直接返回默认值,而不需要Math.max判断。因为只有ArrayList无参构造初始化时,elementData才是DEFAULTCAPACITY_EMPTY_ELEMENTDATA。

private static int calculateCapacity(Object[] elementData, int minCapacity) {
// 如果底层数组仍为默认空数组,设定为初始值10
if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
return Math.max(DEFAULT_CAPACITY, minCapacity);
}
return minCapacity;
}

删除操作

ArrayList删除元素,可以通过底层数组索引删除,通过值来删除以及其他批量删除。

通过底层数组索引删除

public E remove(int index) {
// 边界校验
rangeCheck(index);
// 记录结构性修改
modCount++;
// 暂存原该索引位置元素
E oldValue = elementData(index);

// 计算要移动的元素个数
int numMoved = size - index - 1;
if (numMoved > 0)
System.arraycopy(elementData, index+1, elementData, index,
numMoved);
// 置空末尾元素,便于GC回收内存
elementData[--size] = null;

return oldValue;
}

通过元素值来删除

public boolean remove(Object o) {
// 值为null
if (o == null) {
for (int index = 0; index < size; index++)
if (elementData[index] == null) {
fastRemove(index);
return true;
}
} else { // 值不为空
for (int index = 0; index < size; index++)
if (o.equals(elementData[index])) {
fastRemove(index);
return true;
}
}
return false;
}

根据值删除,存在值为空和非空两种情况,在遍历时分别通过==和equals方法来匹配。需要特别注意的是,删除的是匹配到的第一个元素,而不是所有匹配元素。

private void fastRemove(int index) {
modCount++;
int numMoved = size - index - 1;
if (numMoved > 0)
System.arraycopy(elementData, index+1, elementData, index,
numMoved);
elementData[--size] = null; // clear to let GC do its work
}

除了边界校验,fastRemove方法与remove(int index)方法代码几乎一致。同时我们也发现了System.arraycopy的使用,这一操作在涉及到数组操作中有着广泛应用,例如String。

其他–查询和更新元素

获取索引位置元素

public E get(int index) {
// 边界校验,index大于等于size,抛出IndexOutOfBoundsException
rangeCheck(index);
return elementData(index);
}
E elementData(int index) {
return (E) elementData[index];
}

elementData数组中元素是Object类型,获取指定类型需要强转。

更新指定索引位置元素

public E set(int index, E element) {
// 边界校验
rangeCheck(index);

E oldValue = elementData(index);
elementData[index] = element;
return oldValue;
}

ArrayList迭代器

ArrayList中提供了多种迭代器实现,例如Itr迭代器、ListIterator迭代器。Itr迭代器是AbstractList.Itr的优化版本,而ListIterator迭代器继承Itr,并对其提供了一些扩展,例如add和set操作。

Itr迭代器

private class Itr implements Iterator<E> {
// 下一个元素的索引位置
int cursor;
// 最新被返回的元素索引,如果没有更多元素,设为-1
int lastRet = -1;
// 期望结构修改次数
int expectedModCount = modCount;

Itr() {}
...
final void checkForComodification() {
if (modCount != expectedModCount)
throw new ConcurrentModificationException();
}
}

迭代器变量中,expectedModCount是校验数组结构修改的关键变量。而lastRet变量用于标识是否还有元素可以删除,迭代开始值为-1,无元素;remove操作后,lastRet值也置为-1,表示不能连续删除。

Itr迭代器实现Iterator接口,主要包含了3个方法。

hasNext操作

// 是否还有未迭代的元素
public boolean hasNext() {
// 如果下一个元素位置是size,表示没有元素可以迭代
return cursor != size;
}

next操作

// 返回下一个元素值
public E next() {
// 校验迭代过程中,数组是否有结构性修改
checkForComodification();
// 当前元素索引位置
int i = cursor;
if (i >= size)
throw new NoSuchElementException();
Object[] elementData = ArrayList.this.elementData;
if (i >= elementData.length)
throw new ConcurrentModificationException();
// 迭代索引更新
cursor = i + 1;
// 返回元素值,并设置lastRet
return (E) elementData[lastRet = i];
}

remove操作

public void remove() {
// 如果数组中没有元素
if (lastRet < 0)
throw new IllegalStateException();
// 校验迭代过程中,数组是否有结构性修改
checkForComodification();

try {
// 调外部类remove,删除当前迭代元素
ArrayList.this.remove(lastRet);
// 因为是删除操作,迭代索引位置不变
cursor = lastRet;
// -1表示元素已经被删除
lastRet = -1;
// 修改期望modCount值
expectedModCount = modCount;
} catch (IndexOutOfBoundsException ex) {
throw new ConcurrentModificationException();
}
}

我们可以关注到:

  • 迭代器的删除操作调用了外部类ArrayList的remove(int index)方法,方法必然会导致数组结构性修改(modCount++)。迭代器的remove操作会对expectedModCount进行重新赋值,这也就是自身迭代器add和remove操作不会抛ConcurrentModificationException的原因。
  • remove操作中,将lastRet置为1,避免重复删除。
  • remove操作通常与next方法组合使用,不单独使用。

Fail-fast机制

迭代器有expectedModCount属性用于保存迭代器被调用时的modCount值。如果在迭代过程中,迭代器的增add、删remove、改set、查next/previous 4种操作方法会对modCount进行校验是否被修改。如果被修改,抛出ConcurrentModificationException。
所谓的Fail-Fast机制核心就是下面两句

int expectedModCount = modCount;
条件表达式判断
modCount == expectedModCount

modCount属性继承自AbstractList,标识当前List结构修改的次数。这是一种fail-fast行为,用于防止并发导致不一致的结果。

protected transient int modCount = 0;

【注】注意的是modCount属性并不是volatile的。查阅ConcurrentModificationException源码注释,我们可以发现该异常并不总是表示对象被不同线程并发修改。同一个线程也可能触发该异常。例如,假如集合具有fail-fast迭代器,如果在进行迭代操作时修改数据,迭代器会抛出该异常。

* Note that this exception does not always indicate that an object has
* been concurrently modified by a <i>different</i> thread.  If a single
* thread issues a sequence of method invocations that violates the
* contract of an object, the object may throw this exception.  For
* example, if a thread modifies a collection directly while it is
* iterating over the collection with a fail-fast iterator, the iterator
* will throw this exception.


  • 点赞 5
  • 收藏
  • 分享
  • 文章举报
大唐雨夜 发布了82 篇原创文章 · 获赞 116 · 访问量 9万+ 私信 关注
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: