JVM GC 复习（二） - GC算法、GC过程

第一篇说完了JVM运行时的内存分区。这一篇说说GC的一些基本知识。GC是JVM层面的垃圾回收机制，它不由程序员控制。我们可以问：GC是什么时候对什么东西做了什么事？下文会从这个思路去行文。

GC分为minor GC和major GC。

当新生代的Eden分区满了，会触发minor GC。

但full GC的触发时机和minor GC有所不同：full GC不会也不能等到整个堆内存都被占满才执行，想想这时候，整个JVM已经OOM了。所以，full GC的触发是判断阈值的，生产环境的full GC算法通常都用CMS，CMS回收的触发时机取决于这三个参数：

CMSInitiatingOccupancyFraction：Percentage CMS generation occupancy to start a CMS collection cycle (A negative value means that CMSTirggerRatio is used). See good explanation about that parameter here.
CMSTriggerRatio：Percentage of MinHeapFreeRatio in CMS generation that is allocated before a CMS collection cycle commences
MinHeapFreeRatio：Min percentage of heap free after GC to avoid expansion

CMSInitiatingOccupancyFraction参数设置当堆内存使用占比为多少%时，将触发CMS回收（full GC）。我们的生产环境一般设置为60，也就是说当堆内存（CMSOldGen）占比超过60%时，将触发full GC。

在CMSInitiatingOccupancyFraction有值（> 0）时，JVM会取CMSInitiatingOccupancyFraction的值。当该值 < 0时，JVM会根据CMSTriggerRatio和MinHeapFreeRatio的值计算阈值：

GC threshold = MinHeapFreeRatio * CMSTriggerRatio

JVM使用可达性分析算法（Reachability Analysis）判断对象是否能被回收，具体不赘。只列出GC Root：

被GC root直接或间接引用的对象不能被回收。反之，就是应该回收的对象。

如图：

Alt

大部分的垃圾回收器的实现，其实就是两个阶段：

其中，第一阶段需要借助标记（Marking）实现的。下面详细来看看：

上一节已经说了JVM是使用可达性分析算法判断对象是否存活的。在Marking阶段，JVM会先找到预先定义好的GC Root（也就是上文列出的对象）。然后沿着GC ROOT递归的遍历所有引用的对象，这时候，所有被访问到的对象都会被标记（marked）是存活的。

当遍历完成时，所有存活的对象都被标记了。剩下的对象就是可以被回收的。

在这一步里，有这几点值得注意的：

Marking阶段是stop-the-world的。否则，在标记的同时，所有对象还在不停的变换，会有很严重的bug。因为是stop-the-world的，所以JVM需要让所有线程都进入 safe-point，然后才能挂起线程。更具体的细节不做深入理解了，点到为止吧。
这阶段的耗时取决于所有 alive object 的数量。既不是对象数量，也不是堆的大小。所以，增加堆的容量并不能降低marking阶段的耗时。

标记好存活的对象后，接下来就是清除可以回收的对象。在不同的收集器里，这一阶段可分为这三种做法：

sweep - 清扫这种做法相对是最简单最直观的。JVM会维护一个列表（free-list），marking阶段结束后，JVM会找到可以回收的对象的内存地址，然后记录在free-list里。也就是，free-list标记了哪些内存区域是可以被重用的。下次分配内存时会直接使用free-list上的空间。

sweep最大的问题就是会引起内存碎片的问题。
compact - 压缩（或整理）顾名思义，compact算法会把marking阶段标记的存活的对象压缩到整个堆区域的一侧，而剩下的区域就是可以使用的空闲空间。这种做法的好处是：1. 克服了sweep算法的缺点：内存碎片。2. 为新建对象分配内存变得非常廉价 - 因为有连续的内存空间。

compact最大的缺点是：耗时长，因为将存活对象压缩到堆的一侧，其实是需要object copy的。所以GC pause会较长。
copy - 复制复制的做法和compact相似，只是不是把存活的对象压缩到一侧，而是把alive object复制到新的内存空间。那对比compact算法，它有什么优势呢？就是copy和mark两个阶段可以同时进行。所以它比compact的GC pause会更短。

它的缺点是：它需要更多的内存空间。见图：

http://blog.csdn.net/iter_zc/article/details/41802365
https://www.cubrid.org/blog/understanding-java-garbage-collection
https://www.javaworld.com/article/2078645/java-se/jvm-performance-optimization-part-3-garbage-collection.html
https://www.dynatrace.com/resources/ebooks/javabook/how-garbage-collection-works/
https://plumbr.eu/handbook/what-is-garbage-collection
http://stas-blogspot.blogspot.hk/2011/07/most-complete-list-of-xx-options-for.html
http://xiao-feng.blogspot.com/2008/01/gc-safe-point-and-safe-region.html

You May Also Enjoy