以上是 HotSpot 虛擬機中的 7 個垃圾收集器,連線表示垃圾收集器可以配合使用。
單線程與多線程: 單線程指的是垃圾收集器只使用一個線程進行收集,而多線程使用多個線程;
串行與并行: 串行指的是垃圾收集器與用戶程序交替執(zhí)行,這意味著在執(zhí)行垃圾收集的時候需要停頓用戶程序;并形指的是垃圾收集器和用戶程序同時執(zhí)行。除了 CMS 和 G1 之外,其它垃圾收集器都是以串行的方式執(zhí)行。
1、Serial 收集器
Serial 翻譯為串行,也就是說它以串行的方式執(zhí)行。
它是單線程的收集器,只會使用一個線程進行垃圾收集工作。
它的優(yōu)點是簡單高效,對于單個 CPU 環(huán)境來說,由于沒有線程交互的開銷,因此擁有最高的單線程收集效率。
它是 Client 模式下的默認(rèn)新生代收集器,因為在用戶的桌面應(yīng)用場景下,分配給虛擬機管理的內(nèi)存一般來說不會很大。Serial 收集器收集幾十兆甚至一兩百兆的新生代停頓時間可以控制在一百多毫秒以內(nèi),只要不是太頻繁,這點停頓是可以接受的。
2、ParNew 收集器
它是 Serial 收集器的多線程版本。
是 Server 模式下的虛擬機首選新生代收集器,除了性能原因外,主要是因為除了 Serial 收集器,只有它能與 CMS 收集器配合工作。
默認(rèn)開啟的線程數(shù)量與 CPU 數(shù)量相同,可以使用 -XX:ParallelGCThreads 參數(shù)來設(shè)置線程數(shù)。
3、Parallel Scavenge 收集器
與 ParNew 一樣是多線程收集器。
其它收集器關(guān)注點是盡可能縮短垃圾收集時用戶線程的停頓時間,而它的目標(biāo)是達(dá)到一個可控制的吞吐量,它被稱為“吞吐量優(yōu)先”收集器。這里的吞吐量指 CPU 用于運行用戶代碼的時間占總時間的比值。
停頓時間越短就越適合需要與用戶交互的程序,良好的響應(yīng)速度能提升用戶體驗。而高吞吐量則可以高效率地利用 CPU 時間,盡快完成程序的運算任務(wù),主要適合在后臺運算而不需要太多交互的任務(wù)。
縮短停頓時間是以犧牲吞吐量和新生代空間來換取的: 新生代空間變小,垃圾回收變得頻繁,導(dǎo)致吞吐量下降。
可以通過一個開關(guān)參數(shù)打開 GC 自適應(yīng)的調(diào)節(jié)策略(GC Ergonomics),就不需要手動指定新生代的大小(-Xmn)、Eden 和 Survivor 區(qū)的比例、晉升老年代對象年齡等細(xì)節(jié)參數(shù)了。虛擬機會根據(jù)當(dāng)前系統(tǒng)的運行情況收集性能監(jiān)控信息,動態(tài)調(diào)整這些參數(shù)以提供最合適的停頓時間或者最大的吞吐量。
4、Serial Old 收集器
是 Serial 收集器的老年代版本,也是給 Client 模式下的虛擬機使用。如果用在 Server 模式下,它有兩大用途:
在 JDK 1.5 以及之前版本(Parallel Old 誕生以前)中與 Parallel Scavenge 收集器搭配使用。
作為 CMS 收集器的后備預(yù)案,在并發(fā)收集發(fā)生 Concurrent Mode Failure 時使用。
5、Parallel Old 收集器
是 Parallel Scavenge 收集器的老年代版本。
在注重吞吐量以及 CPU 資源敏感的場合,都可以優(yōu)先考慮 Parallel Scavenge 加 Parallel Old 收集器。
6、CMS 收集器
CMS(Concurrent Mark Sweep),Mark Sweep 指的是標(biāo)記 - 清除算法。
分為以下四個流程:
初始標(biāo)記: 僅僅只是標(biāo)記一下 GC Roots 能直接關(guān)聯(lián)到的對象,速度很快,需要停頓。
并發(fā)標(biāo)記: 進行 GC Roots Tracing 的過程,它在整個回收過程中耗時最長,不需要停頓。
重新標(biāo)記: 為了修正并發(fā)標(biāo)記期間因用戶程序繼續(xù)運作而導(dǎo)致標(biāo)記產(chǎn)生變動的那一部分對象的標(biāo)記記錄,需要停頓。
并發(fā)清除: 不需要停頓。
在整個過程中耗時最長的并發(fā)標(biāo)記和并發(fā)清除過程中,收集器線程都可以與用戶線程一起工作,不需要進行停頓。
具有以下缺點:
吞吐量低: 低停頓時間是以犧牲吞吐量為代價的,導(dǎo)致 CPU 利用率不夠高。
無法處理浮動垃圾,可能出現(xiàn) Concurrent Mode Failure。浮動垃圾是指并發(fā)清除階段由于用戶線程繼續(xù)運行而產(chǎn)生的垃圾,這部分垃圾只能到下一次 GC 時才能進行回收。由于浮動垃圾的存在,因此需要預(yù)留出一部分內(nèi)存,意味著 CMS 收集不能像其它收集器那樣等待老年代快滿的時候再回收。如果預(yù)留的內(nèi)存不夠存放浮動垃圾,就會出現(xiàn) Concurrent Mode Failure,這時虛擬機將臨時啟用 Serial Old 來替代 CMS。
標(biāo)記 - 清除算法導(dǎo)致的空間碎片,往往出現(xiàn)老年代空間剩余,但無法找到足夠大連續(xù)空間來分配當(dāng)前對象,不得不提前觸發(fā)一次 Full GC。
7、G1 收集器
G1(Garbage-First),它是一款面向服務(wù)端應(yīng)用的垃圾收集器,在多 CPU 和大內(nèi)存的場景下有很好的性能。HotSpot 開發(fā)團隊賦予它的使命是未來可以替換掉 CMS 收集器。
堆被分為新生代和老年代,其它收集器進行收集的范圍都是整個新生代或者老年代,而 G1 可以直接對新生代和老年代一起回收。
G1 把堆劃分成多個大小相等的獨立區(qū)域(Region),新生代和老年代不再物理隔離。
通過引入 Region 的概念,從而將原來的一整塊內(nèi)存空間劃分成多個的小空間,使得每個小空間可以單獨進行垃圾回收。這種劃分方法帶來了很大的靈活性,使得可預(yù)測的停頓時間模型成為可能。通過記錄每個 Region 垃圾回收時間以及回收所獲得的空間(這兩個值是通過過去回收的經(jīng)驗獲得),并維護一個優(yōu)先列表,每次根據(jù)允許的收集時間,優(yōu)先回收價值最大的 Region。
每個 Region 都有一個 Remembered Set,用來記錄該 Region 對象的引用對象所在的 Region。通過使用 Remembered Set,在做可達(dá)性分析的時候就可以避免全堆掃描。
如果不計算維護 Remembered Set 的操作,G1 收集器的運作大致可劃分為以下幾個步驟:
初始標(biāo)記
并發(fā)標(biāo)記
最終標(biāo)記: 為了修正在并發(fā)標(biāo)記期間因用戶程序繼續(xù)運作而導(dǎo)致標(biāo)記產(chǎn)生變動的那一部分標(biāo)記記錄,虛擬機將這段時間對象變化記錄在線程的 Remembered Set Logs 里面,最終標(biāo)記階段需要把 Remembered Set Logs 的數(shù)據(jù)合并到 Remembered Set 中。這階段需要停頓線程,但是可并行執(zhí)行。
篩選回收: 首先對各個 Region 中的回收價值和成本進行排序,根據(jù)用戶所期望的 GC 停頓時間來制定回收計劃。此階段其實也可以做到與用戶程序一起并發(fā)執(zhí)行,但是因為只回收一部分 Region,時間是用戶可控制的,而且停頓用戶線程將大幅度提高收集效率。
具備如下特點:
空間整合: 整體來看是基于“標(biāo)記 - 整理”算法實現(xiàn)的收集器,從局部(兩個 Region 之間)上來看是基于“復(fù)制”算法實現(xiàn)的,這意味著運行期間不會產(chǎn)生內(nèi)存空間碎片。
可預(yù)測的停頓:能讓使用者明確指定在一個長度為 M 毫秒的時間片段內(nèi),消耗在 GC 上的時間不得超過 N 毫秒。