您的位置:首页 > 编程语言 > Java开发

Java面试题(二十九) 阿里面试高频问题:四大GC垃圾回收算法与七大垃圾收集器是如何相辅相成的?

2020-07-05 15:26 253 查看

一. GC垃圾回收算法

1. 引用计数算法
2. 复制拷贝算法
3. 标记清除算法
4. 标记整理算法

二. 垃圾收集器

1. 四种主要垃圾收集器分类

1.	Serial 串行回收
为单线程环境所设计且适用于一个线程进行垃圾回收,会暂停所有的用户线程,不适合服务器环境。

2.	Paralle 并行回收
多个垃圾收集线程并行工作,此时用户线程是暂停的,适用于科学计算/大数据处理首台处理等弱交互场景。

3.	CMS 并发标记清除(并发回收)
用户线程和垃圾收集线程同时执行(不一定是并行,可能交替执行),不需要停顿用户线程,互联网公司多用他,适用堆响应时间有要求的场景。

4.	G1
将堆内存分割成不同的区域然后并发的对其进行垃圾回收,可以减少空间碎片的产生,还可以设置垃圾收集停顿时间。

5.	ZGC
现在新出现的垃圾收集器,可能是未来的明星收集器,现在咱们暂且不谈他。

2. 怎么查看服务器默认的垃圾收集器是哪个?

1.查看默认垃圾收集器:
java -XX:+PrintCommandLinedFlags -version

图片演示:

3. 生产上如何配置七大垃圾收集器?

1. 七大垃圾收集器:
新生代的垃圾收集器:
1. Serial
2. Parallel
3. ParNew
老年代的垃圾收集器:
4. CMS
5. SerialOld
6. ParallelOld
横跨新生代与老年代的垃圾收集器:
7. G1

3. 七大垃圾收集器在新生代与老年代的分布图:

4. 七大收集器在新生代与老年代的联系图:

5. Server/Client模式分别是什么意思?

1. 适用范围:只需要掌握Server模式即可,Client模式基本不会用

2. 操作系统:
32位Window操作系统,不论硬件如何都默认使用Client的JVM模式
32位其他操作系统,2G内存同时有2个cpu以上用Server模式,低于该配置还是Client模式
64位only server模式

三. 新生代中的垃圾收集器

1. 串行GC (Serial)/(Serial Copying)

串行收集器:Serial收集器 1:1
一个单线程的收集器,在进行垃圾收集的时候,必须暂停其他所有的工作线程直到它收集结束。
串行收集器是最古老,最稳定以及效率最高的收集器,只使用一个线程去回收但其在进行垃圾收集过程中可能会产生较长的停顿(Stop-The-World 状态)。
虽然在收集垃圾过程中需要暂停所有其他的工作线程,但是它简单高效,对于限定单个CPU环境来说,没有线程交互的开销可以获得最高的单线程垃圾收集效率,
因此Serial垃圾收集器依然是java虚拟机运行在Client模式下默认的新生代垃圾收集器。

对应的JVM配置参数是:-XX:+UseSerialGC
开启后会使用:Serial(Young区)+Serial Old(Old区)的收集器组合
表示:新生代、老年代都会使用串行回收收集器,新生代使用复制算法,老年代使用标记整理算法
DefNew -- Tenured

2. 并行GC (ParNew)

并行收集器 N:1
使用多线程进行垃圾回收,在垃圾收集时,会Stop-the-world(简称STW)暂停其他所有的工作线程直到它收集结束。

ParNew收集器其实就是Serial收集器新生代的并行多线程版本,最常见的应用场景时配合老年代的CMS GC工作,
其余的行为和Serial收集器完全一样,ParNew垃圾收集器在垃圾收集过程成中同样也要暂停所有其他的工作线程,
他是很多java虚拟机运行在Server模式下新生代的默认垃圾收集器。

常用对应JVM参数:-XX:+UseParNewGC 启用ParNew收集器,只影响新生代的收集,不影响老年代
开启后会使用:ParNew(Young区)+Serial Old(Old 区)的收集器组合,新生代使用复制算法,老年代采用标记-整理算法
ParNew --Tenured
备注:
-XX:ParallelGCThreads 限制线程数量,默认开启和CPU数目相同的线程数

3. 并行回收GC (Parallel)/(Parallel Scavenge)

并行收集器 N:N
类似ParNew也是一个新生代垃圾收集器,使用复制算法,也是一个并行的多线程的垃圾收集器,俗称吞吐量有限收集器。
串行收集器在新生代和老年代的并行化。

他重点关注的是:
可控制的吞吐量(Thoughput=运行用户代码时间/(运行用户代码时间+垃圾收集时间),
比如程序运行100分钟,垃圾收集时间1分钟,吞吐量就是99%)。
高吞吐量意味着高效利用CPU时间,他多用于在后台运算而不需要太多交互的任务。

自适应调节策略也是ParallelScavenge收集器与ParNew收集器的一个重要区别。
自适应调节策略:虚拟机会根据当前系统的运行情况和性能监控信息,动态调整这些参数以提供最合适的停顿时间

-XX:MaxGCPauseMillis) 最大的吞吐量
-XX:ParallelGCThreads=数字N 表示启动多少个GC线程
CPU>8 n=5/8
CPU<8 n=实际个数
-XX:+UseParallelGC
-XX:+UseParallelOldGC

四. 老年代中的垃圾收集器

1. 串行GC(Serial Old)/(Serial MSC)

2. 并行GC(Parallel Old)/(Parallel MSC)

Parallel Scavenge的老年代版本,使用多线程的标记-整理算法,Parallel Old收集器在JDK1.6开始提供
JDK1.6之前,新生代使用ParallelScavenge收集器只能搭配年老代的Serial Old收集器,只能保证新生代的吞吐量优先,
无法保证整体的吞吐量。在JDK1.6之前(ParallelScavenge+SerialOld)

Parallel Old正式为了在老年代同样提供吞吐量游戏的垃圾收集器,系统对吞吐量要求比较高,
JDK1.8后考虑新生代Parallel Scavenge和年老代Parallel Old收集器的搭配策略

常用参数:-XX:+UseParallelOldGC

新生代Paralle + 老年代Paralle Old

3. 并发标记清除GC(CMS)

CMS收集器(Concurrent Mark Sweep:并发标记清除)是一种以获取最短回收停顿时间为目标的收集器。
适合在互联网站或者B/S系统的服务器上,这列应用尤其中使服务器的响应速度,希望系统停顿时间最短。
CMS非常适合堆内存大、CPU核数多的服务区端应用,也是G1出现之前大型应用的首选收集器。

并发标记清除收集器:ParNew + CMS + Serial Old

CMS,并发收集低停顿,并发指的是垃圾收集线程与用户线程一起执行

JVM参数:-XX:+UseConcMarkSweepGC,开启该参数后会自动将-XX:UseParNewGC打开
开启该参数后,使用ParNew + CMS+Serial Old的收集器组合,Serial Old将作为CMS出错的后备收集器

1)并发收集器标记的四步过程:

初始标记(CMS initial mark)
只是标记一下GC Roots能够直接关联的对象,速度很快,仍然需要暂停所有的工作线程

并发标记(CMS concurrent mark)
和用户线程一起进行GC Roots跟踪过程,和用户线程一起工作,不需要暂停工作线程。主要标记过程,标记全部对象

重新标记(CMS remark)
为了修正并发标记期间,因用户程序继续运行而导致标记产生变动的那一部分对象的标记记录,仍然需要暂停所有的工作线程,
由于并发标记时,用户线程依然运行,因此在正式清理前,再做修正

并发清除(CMS concurrent sweep)
和用户线程一起清除GC Roots不可达对象,和用户线程一起工作,不需要暂停工作线程。基于标记结果,直接清理对象
由于耗时最长的并发标记和并发清除过程中,垃圾收集线程可以和用户线程一起并发工作,所以总体上看来CMS收集器的内存回收和用户线程是一起并发的执行

2)优缺点:

并发收集停顿低,并发执行,CPU资源压力大
由于并发进行,CMS在收集与应用线程会同时增加对堆内存的占用,也就是说,CMS必须要在老年代堆内存用尽之前完成垃圾回收,
否则CMS回收失败时,将触发担保机制,串行老年代收集器将会以STW的方式进行一次GC,从而造成较大停顿时间

采用的标记清除算法会导致大量的碎片

标记清除算法无法整理空间碎片,老年代空间会随着应用时长被逐步耗尽,最后将不得不通过担保机制堆内存进行压缩。

CMS也提供了参数-XX:CMSFullGCsBeForeCompaction(默认0,即每次都进行内存整理)来制定多少次CMS收集之后,
进行一次压缩的FullGC

4. 如何选择垃圾选择器?

1. 单CPU或小内存,单机内存
-XX:+UseSerialGC

2. 多CPU,需要最大吞吐量,如后台计算型应用
-XX:+UseParallelGC
-XX:+UseParallelOldGC

3. 多CPU,最求低停顿时间,需快速相应,如互联网应用
-XX:+ParNewGC
-XX:+UseConcMarkSweepGC

5. 总结新生代与老年代收集器的算法图:

五. G1收集器

1. G1的介绍:

G1(Garbage-First)收集器,是一款面向服务端应用的收集器
应用在多处理器和大容量内存环境中,在实现高吞吐量的同时,尽可能的满足垃圾收集暂停时间的要求

和CMS收集器一样,能与应用程序线程并发执行整理空闲空间更快
需要更多的时间来预测GC停顿时间
不希望牺牲大量的吞吐性能
不需要更大的Java Heap

G1收集器的设计目标是取代CMS收集器,和CMS相比,在以下方面表现更出色:

G1是一个由整理内存过程的垃圾收集器,不会产生很多内存碎片

G1的Stop The World(STW)更可控,G1在停顿时间上添加了预测机制,用户可以指定期望停顿时间

CMS垃圾收集器虽然减少了暂停应用程序的运行时间,但是他还是存在着内存碎片问题。
于是为了取出内存碎片问题,同时又保留CMS垃圾收集器低暂停时间的优点,JAVA7发布了G1垃圾收集器

主要改变的是Eden,Survivor和Tenured等内存区域不再是连续的了,而是变成了一个个大小一样的region(区域化),
每个region从1M到32M不等。一个region有可能属于Eden,Survivor或Tenured内存区域

2. G1的特点:

1. G1能充分利用多CPU、多核环境优势,尽量缩短STW

2. G1整体上采用标记-整理算法,局部是通过复制算法,不会产生内存碎片

3. 宏观上G1之中不再区分新生代和老年代。把内存划分成多个独立的子区域(Region),可以近似理解为一个棋盘

4. G1收集器里面将整个的内存区都混合在一起了,但其本身依然在小范围内要进行年轻代和老年代的区分,保留了新生代和老年代,
但它们不再是物理隔离,而是一部分Region的集合,且不需要Region是连续的,也就是说依然会采用不同GC方式来处理不同的区域

5. G1虽然也是分代收集器,但整个内存分区不存在物理上的新生代与老年代的区别,也不需要完全独立的survivor(to space)堆做复制准备。
G1只有逻辑上的分代概念,或者说每个分区都可能随G1的运行在不同代之间前后切换

3. 底层原理:

Region区域化垃圾收集器
最大好处是化整为零,避免全内存扫描,只需要按照区域来进行扫描即可
区域化内存划片Region,整体变为了一系列不连续的内存区域,避免了全内存区的GC操作

核心思想是将整个堆内存区域分成大小相同的子区域,在JVM启动时会自动共设置这些子区域的大小

在堆的使用上,G1并不要求对象的存储一定是物理上连续的,只要逻辑上连续即可,每个分区也不会固定地为某个代服务,
可以按需在新生代和老年代之间切换

启动时可以通过参数
-XX:G1HeapRegionSize可指定分区大小(1~32M,且必须是2的幂),默认将整堆划分为2048个分区
大小范围在1-32M,最多能设置2048个区域,也即能够支持的最大内存为64G

G1算法将堆划分为诺干个区域,他仍然属于分代收集器

这些Region的一部分包含新生代,新生代的垃圾收集依然采用暂停所有应用线程的方式,
将存活对象拷贝到老年代或Survivor空间,
这些Region的一部分包含老年代,G1收集器通过将对象从一个区域复制到另外一个区域,完成了清理工作。
这就意味着,在正常的处理过程中,G1完成了堆的压缩,这样也就不会有CMS内存碎片问题的存在了

在G1中,还有一种特殊区域,Humongous区域,如果一个对象占用的空间超过了分区容量50%以上,
G1收集器就认为这是一个巨型对象。

这些巨型对象默认直接会被分配在老年代,但是如果他是一个短期存在的巨型对象,就会对垃圾收集器造成负面影响。

为了解决这个问题,G1划分了一个Humongous区,他用来专门存放巨型对象。如果一个H区装不下,
那么G1就会寻找连续的H分区来存储。为了能找到连续的H区,有时候不得不启动Full GC

回收步骤:
针对Eden区进行收集,Eden区耗尽后会被触发,主要小区域收集+形成连续的内存块,避免内存碎片
Eden区的数据移动到Survivor区,假如出现Survivor区空间不够,Eden区数据就会晋升到Old区
Survivor区的数据移动到新的Survivor区,部分数据晋升到Old区
最后Eden区收拾干净了,GC结束,用户的应用程序继续执行

四步过程:
1. 初始标记:只标记GC Roots能直接关联到的对象
2. 并发标记:进行GC Roots Tracing的过程
3. 最终标记:修正并发标记期间,因程序运行导致标记发生变化的那一部分对象
4. 筛选回收:根据时间来进行价值最大化的回收

4. G1常用配置参数:

-XX:+UseG1GC
设置使用G1收集器

-XX:G1HeapRegionSize=n
设置的G1区域的大小,值是2的幂,范围是1-32MB,目标是根据最小的java堆大小划分出约2048个区域

-XX:MaxGCPauseMillis=n
最大GC停顿时间,这是个软目标,JVM将尽可能(但不保证)停顿小于这个时间

-XX:InitiatingHeapOccupancyRercent=n
堆占用了多少的时候就触发GC,默认45

-XX:ConcGcThreads=n
并发GC使用的线程数

-XX:G1ReservePercent=n
设置作为空闲空间的预留内存百分比,以降低目标空间溢出的风险,默认10%

5. G1和CMS相比优势:

1.	G1不会产生内存碎片

2.	可以精确控制停顿时间。该收集器是把整个堆(新生代、老年代)划分成多个固定大小的区域,
根据允许停顿的时间去收集垃圾最多的区域

总结:面试上涵盖的垃圾收集器,基本上就上面这些了,熟练掌握进入大厂不是梦!

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: