這篇文章給大家介紹一文讀懂JVM中的垃圾回收器,內容非常詳細,感興趣的小伙伴們可以參考借鑒,希望對大家能有所幫助。
JVM的GC經過多年的發展,大家對Minor GC、major GC的理解并不完全一致,所以我不打算在本文中使用這個概念。我把GC大概分為一下4類:
因為筆者目前使用G1還是比較少的,所以本文不打算將G1。
垃圾回收器算法
目前主流垃圾回收器都采用的是可達性分析算法來判斷對象是否已經存活,不使用引用計數算法判斷對象時候存活的原因在于該算法很難解決相互引用的問題。
標記-清除算法(Mark-Sweep)
標記-清除算法由標記階段和清除階段構成。標記階段是把所有活著的對象都做上標記的階段;清除階段是把那些沒有標記的對象,也就是非活動對象回收的階段。通過這兩個階段,就可以令不能利用的內存空間重新得到利用。
從標記-清除算法我們可以看出,該算法不涉及對象移動,但是可能會產生內存碎片化問題??臻g碎片太高可能會導致程序運行時需要分配較大內存時候,無法找到足夠的連續內存,需要其他垃圾回收幫助回收內存。
復制算法(Copying)
復制算法內存空間分為兩塊區域:From、to,每次只使用其中一塊,在垃圾回收時將正在使用的內存中的存活對象復制到未被使用的內存塊中,之后,清除正在使用的內存塊中的所有對象,交換兩個內存的角色,完成垃圾回收。
上面那種復制算法有一半的空間是浪費的。所以在Java新生代把內存區域分為Eden空間、from、to空間3個部分,from和to空間也稱為survivor 空間,用于存放未被回收的對象。對象開始都是Eden生成;當回收時,將Eden和from中存活的對象移動到to區域中。
復制算法存在空間浪費的情況,始終都要保持一個Survivor是空閑的,并且在GC的時候要是存活對象大小超過了Survivor中的大小,就需要另外的策略存儲存活對象。
目前open JDK新生代回收策略就是采用的復制算法,其中Eden和Survivor的默認配置為8:1
標記-壓縮算法(Mark-Compact)
標記-壓縮算法由標記階段和壓縮階段構成。標記階段標記-清除算法中的標記階段完全一樣,壓縮階段是讓所有存活的對象向一端移動。這樣空閑內存都在另外一端,屬于連續空間,不存在內存碎片化問題,但是會產生對象移動。
分代算法(Generational GC)
根據對象的不同生命周期分別管理, JVM 中將對象分為我們熟悉的新生代、老年代和永久代分別管理。這樣做的好處就是可以根據不同類型對象進行不同策略的管理,例如新生代中對象更新速度快,就會使用效率較高的復制算法。老年代中內存空間相對分配較大,而且時效性不如新生代強,就會常常使用Mark-Sweep-Compact (標記-清除-壓縮)算法。
各種算法性能比較
常見的垃圾回收器
垃圾回收器分類
總體上可以把Java的垃圾回收器分為3類:
Java垃圾回收器主要有6種,各自優缺點以及組合關系如下:
其中的連線表示young gc和old gc可以搭配使用
垃圾回收器選擇策略:
目前很大一部分的Java應用都集中在互聯網的服務器端,這類應用尤其關系服務的響應時間,希望應用暫停時間更短,所以基本上使用的都是ParNew + CMS,這也是我司默認使用的配置。
CMS垃圾回收器
在啟動JVM參數加上 -XX:+UseConcMarkSweepGC ,這個參數表示對于老年代的回收采用 CMS。
CMS執行過程
CMS 的回收過程主要分為下面的幾個步驟:
CMS日志解析
標準的CMS日志如下:
2018-11-10T18:23:27.531+0800: 1495270.652: [GC (CMS Initial Mark) [1 CMS-initial-mark: 2008820K(2510848K)] 2038212K(4398336K), 0.0231086 secs] [Times: user=0.01 sys=0.00, real=0.03 secs] 2018-11-10T18:23:27.554+0800: 1495270.675: [CMS-concurrent-mark-start] 2018-11-10T18:23:27.644+0800: 1495270.765: [CMS-concurrent-mark: 0.090/0.090 secs] [Times: user=0.34 sys=0.03, real=0.09 secs] 2018-11-10T18:23:27.644+0800: 1495270.765: [CMS-concurrent-preclean-start] 2018-11-10T18:23:27.654+0800: 1495270.775: [CMS-concurrent-preclean: 0.010/0.010 secs] [Times: user=0.02 sys=0.00, real=0.01 secs] 2018-11-10T18:23:27.655+0800: 1495270.775: [CMS-concurrent-abortable-preclean-start] 2018-11-10T18:23:32.305+0800: 1495275.425: [CMS-concurrent-abortable-preclean: 4.623/4.650 secs] [Times: user=7.01 sys=1.01, real=4.65 secs] 2018-11-10T18:23:32.307+0800: 1495275.427: [GC (CMS Final Remark) [YG occupancy: 847369 K (1887488 K)]1495275.427: [Rescan (parallel) , 0.0902177 secs]1495275.518: [weak refs processing, 0.0514433 secs]1495275.569: [class unloading, 0.0256119 secs]1495275.595: [scrub symbol table, 0.0074695 secs]1495275.602: [scrub string table, 0.0015014 secs][1 CMS-remark: 2008820K(2510848K)] 2856190K(4398336K), 0.1806988 secs] [Times: user=0.68 sys=0.00, real=0.18 secs] 2018-11-10T18:23:32.488+0800: 1495275.609: [CMS-concurrent-sweep-start] 2018-11-10T18:23:33.660+0800: 1495276.781: [CMS-concurrent-sweep: 1.172/1.172 secs] [Times: user=1.89 sys=0.24, real=1.17 secs] 2018-11-10T18:23:33.661+0800: 1495276.782: [CMS-concurrent-reset-start] 2018-11-10T18:23:33.667+0800: 1495276.788: [CMS-concurrent-reset: 0.006/0.006 secs] [Times: user=0.01 sys=0.00, real=0.01 secs]
初始標記(CMS Initial Mark)
并發標記(CMS-concurrent-mark)
并發標記就需要標記出 GC ROOTS 關聯到的對象的引用對象有哪些。比如說 A -> B (A 引用 B,假設 A 是 GC Roots 關聯到的對象),那么這個階段就是標記出 B 對象, A 對象會在初始標記中標記出來。
并發預清理(CMS-concurrent-preclean)
這個階段主要并發查找在做并發標記階段時從年輕代晉升到老年代的對象或老年代新分配的對象(大對象直接進入老年代)或被用戶線程更新的對象,來減少重新標記階段的工作量。
重新標記(CMS Final Remark)
由于在并發標記和并發預清理這個階段,用戶線程和GC 線程并發,假如這個階段用戶線程產生了新的對象,總不能被 GC 掉吧。這個階段就是為了讓這些對象重新標記。該階段也會暫停應用
并發清理(CMS-concurrent-sweep)
這個階段的目的就是移除那些不用的對象,回收他們占用的空間并且為將來使用。注意這個階段會產生新的垃圾,新的垃圾在此次GC無法清除,只能等到下次清理。這些垃圾有個專業名詞:浮動垃圾。
并發重置(CMS-concurrent-reset)
CMS清除內部狀態,為下次回收做準備。
注意:CMS雖然是老年代算法,但也是需要掃描新生代區域的。
CMS算法降級
cms存在著內存碎片化問題:申請內存時,雖然總內存大于申請內存,但是沒有連續內存大于申請內存,導致內存申請失敗。CMS提供了機制(CMS GC降級到Full GC)來解決該問題。Full GC使用的算法是mark-sweep-compact(類似于Serial垃圾回收器),他的作用域在整個堆的對象,包括年輕代、老年代、持久代,但compaction是可選的。其中參數CMSFullGCsBeforeCompaction=N表示每隔N次真正的full GC才做一次壓縮(而不是每N次CMS GC就做一次壓縮,目前JVM里沒有這樣的參數),CMSFullGCsBeforeCompaction默認值是0,也就是每次full GC都會進行內存壓縮。這個盡量使用默認值,不然內存碎片化可能會更嚴重些。
那么配置的CMS GC啥時候會觸發Full gc呢?主要有下面幾種情況觸發Full Gc:
如何識別是執行的是CMS GC還是 Full GC呢?主要是根據GC log,CMS GC會在日志中標記出各個執行階段,但是要是執行Full GC只會顯示full次數加1。
CMS相關參數
-XX:CMSInitiatingOccupancyFraction=N 和-XX:+UseCMSInitiatingOccupancyOnly
這兩個設置一般配合使用, 目的在于降低CMS GC頻率或者增加頻率。
-XX:CMSInitiatingOccupancyFraction=N 是指設定CMS在對內存占用率達到N%的時候開始進行CMS GC。
-XX:+UseCMSInitiatingOccupancyOnly 只是用設定的回收閾值(上面指定的N%),如果不指定,JVM僅在第一次使用設定值,后續則自動調整.
-XX:+CMSScavengeBeforeRemark
這個參數表示CMS GC前啟動一次ygc,目的在于減少old區域對ygc區域的引用,降低remark時的開銷,一般CMS的GC耗時80%都在remark階段
-XX:+UseCMSCompactAtFullCollection和-XX:CMSFullGCsBeforeCompaction=N
這兩個參數要配合使用,其中CMSFullGCsBeforeCompaction上面已經講解過了。
CMS 的缺點
關于一文讀懂JVM中的垃圾回收器就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。