您的位置:首页 > 其它

JVM基础(6)——G1收集器及G1日志分析

2016-11-15 12:57 148 查看
系列文章规划:

JVM基础(1)——内存模型

JVM基础(2)——内存管理

JVM基础(3)——编译机制

JVM基础(4)——类加载机制

JVM基础(5)——垃圾回收和调优

JVM基础(6)——G1收集器及G1日志分析

JVM基础(7)——jdk常用内置工具

1 G1简介

1.1 概述

G1 (Garbage-First)是一款面向服务器的垃圾收集器,主要针对配备多核处理器及大容量内存的机器。

在极大概率满足GC停顿时间要求的同时,还具备高吞吐量的特性.。Oracle JDK 7 update 4 及以上版本已完全支持。其设计目标如下:

可以像CMS收集器一样,GC操作与应用的线程一起并发执行;

紧凑的空闲内存区间且没有很长的GC停顿时间;

需要更多可预测的GC停顿时间;

不想牺牲太多吞吐量性能;

启动后不需要请求更大的Java堆。

G1的长期目标是取代CMS(Concurrent Mark-Sweep Collector, 并发标记-清除)。因为特性的不同,G1成为比CMS更好的解决方案。其中一个区别是,G1是一款压缩型的收集器。G1通过有效的压缩完全避免了对细微空闲内存空间的分配,不用依赖于regions,这不仅大大简化了收集器,而且还消除了潜在的内存碎片问题。除压缩以外,G1的垃圾收集停顿也比CMS容易估计,也允许用户自定义所希望的停顿参数(pause targets)。

内存占用

如果从 ParallelOldGC 或者 CMS收集器迁移到 G1,可能会看到JVM进程占用更多的内存(a larger JVM process size)。 这在很大程度上与 “accounting” 数据结构有关,如 Remembered Sets 和 Collection Sets。

Remembered Sets 简称 RSets。跟踪指向某个heap区内的对象引用。 堆内存中的每个区都有一个 RSet。 RSet 使heap区能并行独立地进行垃圾集合。 RSets的总体影响小于5%。

Collection Sets 简称 CSets。收集集合, 在一次GC中将执行垃圾回收的heap区。GC时在CSet中的所有存活数据(live data)都会被转移(复制/移动)。集合中的heap区可以是 Eden, survivor, 和/或 old generation。CSets所占用的JVM内存小于1%。

推荐使用G1的场景

G1的首要目标是为需要大量内存的系统提供一个保证GC低延迟的解决方案。 也就是说堆内存在6GB及以上,稳定和可预测的暂停时间小于0.5秒。

如果应用程序具有如下的一个或多个特征,那么将垃圾收集器从CMS或ParallelOldGC切换到G1将会大大提升性能。

Full GC 次数太频繁或者消耗时间太长.

对象分配的频率或代数提升(promotion)显著变化.

受够了太长的垃圾回收或内存整理时间(超过0.5~1秒)

注意: 如果正在使用CMS或ParallelOldGC,而应用程序的垃圾收集停顿时间并不长,那么建议继续使用现在的垃圾收集器。使用最新的JDK时,并不要求切换到G1收集器。

1.2 G1内存结构

G1堆由多个区(region)组成,每个区大小1M~32M,逻辑上区有3种类型,包括(Eden、Survivor、Old),按分代划分包括:年轻代(Young Generation)和老年代(Old Generation)。



年轻代由非连续区组成,可以很方便的进行年轻代大小修改。

1.3 Young GC

Young GC是stop-the-world活动,会导致整个应用线程的停止。其过程如下:

新对象进入Eden区

存活对象拷贝到Survivor区;

存活时间达到年龄阈值时,对象晋升到Old区。

young gc是多线程并行执行的。



1.4 Old GC

Old GC包含以下阶段(其中有些阶段是属于Young GC的):

初始并行阶段(Initial Marking Phase)

Root区扫描(Root Region Scanning)

并行标记(Concurrent Marking)

重标记(Remark)

清除(Cleanup)

复制(Copying)



初始并行阶段(Initial Marking Phase)

属于Young GC范畴,是stop-the-world活动。对持有老年代对象引用的Survivor区(Root区)进行标记。

Root区扫描(Root Region Scanning)

扫描Survivor区中的老年代对象引用,该阶段发生在应用运行时,必须在Young GC前完成。

并行标记(Concurrent Marking)

找出整个堆中存活的对象,对于空区标记为“X”。该阶段发生在应用运行时,同时该阶段活动会被Young GC打断。

重标记(Remark)

清除空区,重计算所有区的存活状态(liveness),是stop-the-world活动。

清除(Cleanup)

选择出存活状态低的区进行收集。

计算存活对象和空区,是stop-the-world活动。

更新记录表,是stop-the-world活动。

重置空区,将其加入空闲列表,是并行活动。

复制(Copying)

该阶段是stop-the-world活动,负责将存活对象复制到新的未使用的区。

可以发生在年轻代区,日志记录为[GC pause (young)]。

也可以同时发生在年轻代区和老年代区,日志记录为[GC Pause (mixed)]。

2 配置G1

参数/默认值含义
-XX:+UseG1GC使用 G1 垃圾收集器
-XX:MaxGCPauseMillis=200设置期望达到的最大GC停顿时间指标(JVM会尽力实现,但不保证达到)
-XX:InitiatingHeapOccupancyPercent=45启动并发GC周期时的堆内存占用百分比. G1之类的垃圾收集器用它来触发并发GC周期,基于整个堆的使用率,而不只是某一代内存的使用比. 值为 0 则表示”一直执行GC循环”. 默认值为 45.
-XX:NewRatio=n新生代与老生代(new/old generation)的大小比例(Ratio). 默认值为 2.
-XX:SurvivorRatio=neden/survivor 空间大小的比例(Ratio). 默认值为 8.
-XX:MaxTenuringThreshold=n提升年老代的最大临界值(tenuring threshold). 默认值为 15.
-XX:ParallelGCThreads=n设置垃圾收集器在并行阶段使用的线程数,默认值随JVM运行的平台不同而不同.
-XX:ConcGCThreads=n并发垃圾收集器使用的线程数量. 默认值随JVM运行的平台不同而不同.
-XX:G1ReservePercent=n设置堆内存保留为假天花板的总量,以降低提升失败的可能性. 默认值是 10.
-XX:G1HeapRegionSize=n使用G1时Java堆会被分为大小统一的的区(region)。此参数可以指定每个heap区的大小. 默认值将根据 heap size 算出最优解. 最小值为 1Mb, 最大值为 32Mb.

3 最佳实践

在使用 G1 作为垃圾收集器时,你应该遵循下面这些最佳实践的指导.

3.1 不要设置年轻代的大小(Young Generation Size)

假若通过 -Xmn 显式地指定了年轻代的大小, 则会干扰到 G1收集器的默认行为.

G1在垃圾收集时将不再关心暂停时间指标. 所以从本质上说,设置年轻代的大小将禁用暂停时间目标.

G1在必要时也不能够增加或者缩小年轻代的空间. 因为大小是固定的,所以对更改大小无能为力.

3.2 响应时间指标(Response Time Metrics)

设置 XX:MaxGCPauseMillis= 时不应该使用平均响应时间(ART, average response time) 作为指标,而应该考虑使用目标时间的90%或者更大作为响应时间指标。也就是说90%的用户请求响应时间不会超过预设的目标值. 记住,暂停时间只是一个目标,并不能保证总是得到满足。

3.3 什么是转移失败(Evacuation Failure)?

对 survivors 或 promoted objects 进行GC时,如果JVM的heap区不足,就会发生提升失败(promotion failure)。堆内存不能继续扩充,因为已经达到最大值了。当使用 -XX:+PrintGCDetails 时将会在GC日志中显示 to-space overflow (to-空间溢出)。

GC仍继续所以空间必须被释放,拷贝失败的对象必须被放到正确的位置(tenured in place),CSet指向区域中的任何 RSets 更新都必须重新生成(regenerated),所有这些步骤都是代价高昂的。

3.4 如何避免转移失败(Evacuation Failure)

要避免避免转移失败, 考虑采纳下列选项:

增加堆内存大小

增加 -XX:G1ReservePercent=n, 其默认值是 10.

G1创建了一个假天花板(false ceiling),在需要更大 ‘to-space’ 的情况下会尝试从保留内存获取(leave the reserve memory free).

更早启动标记周期(marking cycle)

通过采用 -XX:ConcGCThreads=n 选项增加标记线程(marking threads)的数量.

4 日志分析

G1的调优需要利用日志信息,但首先我们需要收集到日志并能理解日志信息。

4.1 日志格式

3种日志详情格式:

-verbosegc。和-XX:+PrintGC等效,日志级别为fine。

-XX:+PrintGCDetails。日志级别为finer,包含的信息比较完整。

-XX:+UnlockExperimentalVMOptions -XX:G1LogLevel=finest。日志级别为finest,包含finer信息以及每个工作线程的信息。

2种时间戳格式:

-XX:+PrintGCTimeStamps。毫秒时间。

-XX:+PrintGCDateStamps。日期时间。

-XX:+PrintGCDetails日志示例:

0.522: [GC pause (young), 0.15877971 secs]                                          // 程序运行0.522秒后发生一个Evacuation Pause,耗时0.15877971秒。
[Parallel Time: 157.1 ms]                                                    // 并行GC耗时157.1 ms
[GC Worker Start (ms):  522.1  522.2  522.2  522.2                        // 每个工作线程启动时间,时间根据线程id排序
Avg: 522.2, Min: 522.1, Max: 522.2, Diff:   0.1]                         // 所有工作线程启动时间的平均值、最小值、最大值、差别
[Ext Root Scanning (ms):  1.6  1.5  1.6  1.9                              // 每个扫描root的线程耗时
Avg:   1.7, Min:   1.5, Max:   1.9, Diff:   0.4]
[Update RS (ms):  38.7  38.8  50.6  37.3                                  // 每个执行更新RS(Remembered Sets)的线程的耗时
Avg:  41.3, Min:  37.3, Max:  50.6, Diff:  13.3]
[Processed Buffers : 2 2 3 2                                           // 每个工作线程执行UB(Update Buffers)的数量
Sum: 9, Avg: 2, Min: 2, Max: 3, Diff: 1]
[Scan RS (ms):  9.9  9.7  0.0  9.7                                        // 每个工作线程扫描RS的耗时
Avg:   7.3, Min:   0.0, Max:   9.9, Diff:   9.9]
[Object Copy (ms):  106.7  106.8  104.6  107.9                            // 每个工作线程执行OC(Object Copy)的耗时
Avg: 106.5, Min: 104.6, Max: 107.9, Diff:   3.3]
[Termination (ms):  0.0  0.0  0.0  0.0                                    // 每个工作线程执行终止的耗时
Avg:   0.0, Min:   0.0, Max:   0.0, Diff:   0.0]
[Termination Attempts : 1 4 4 6                                        // 每个工作线程执行终止的重试的次数
Sum: 15, Avg: 3, Min: 1, Max: 6, Diff: 5]
[GC Worker End (ms):  679.1  679.1  679.1  679.1                          // 每个工作线程终止时的时间
Avg: 679.1, Min: 679.1, Max: 679.1, Diff:   0.1]
[GC Worker (ms):  156.9  157.0  156.9  156.9                              // 每个工作线程的生命时间
Avg: 156.9, Min: 156.9, Max: 157.0, Diff:   0.1]
[GC Worker Other (ms):  0.3  0.3  0.3  0.3                                // 每个工作线程执行其他任务(上述未统计的内容)的耗时
Avg:   0.3, Min:   0.3, Max:   0.3, Diff:   0.0]
[Clear CT:   0.1 ms]                                                         // 清理CT(Card Table)的耗时
[Other:   1.5 ms]                                                            // 其他任务(上述未统计的内容)的耗时
[Choose CSet:   0.0 ms]                                                   // 选择分区的耗时
[Ref Proc:   0.3 ms]                                                      // 执行关联(Reference objects)的耗时
[Ref Enq:   0.0 ms]                                                       // 将references放入ReferenceQueues的耗时
[Free CSet:   0.3 ms]                                                     // 释放CS(collection set)的耗时
[Eden: 12M(12M)->0B(10M) Survivors: 0B->2048K Heap: 13M(64M)->9739K(64M)]    // Eden容量为12M,使用了12M,GC后变为0,容量目标大小增加到13M。
// SurvivorsGC前为0,GC后变为2048K
// GC前,Heap容量为64M,使用13M;GC后,Heap容量为64M,使用9739k。
[Times: user=0.59 sys=0.02, real=0.16 secs]


5 调优

//TODO

参考文档

Getting Started with the G1 Garbage Collector

Garbage First Garbage Collector Tuning

Java HotSpot Garbage Collection

Understanding G1 GC Logs
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: