我们注意到偶尔使用带有并发标记溢出的G1垃圾收集器的完整GC.曾经有一个并发标记重置溢出,这个溢出将在下一个并发标记阶段继续.最终,它导致完整的GC,因为并发标记似乎不再起作用.
我们有四台机器运行相同的基于Apache Storm的应用程序,具有相同的数据流量.每周只有一台机器有一次这种体验.
这与错误有关:'并发标记期间标记堆栈溢出时,G1不会扩展标记堆栈' https://bugs.openjdk.java.net/browse/JDK-8065402
根据上面的建议,我们将并发标记线程从4增加到8,并将堆大小从8GB增加到16GB.但是,完整的GC仍然会发生,唯一的区别是发生的事件会延迟.
还有其他建议吗?
这是GC日志:
Java HotSpot(TM) 64-Bit Server VM (25.65-b01) for linux-amd64 JRE(1.8.0_65b17),
built on Oct 6 2015 17:16:12 by "java_re" with gcc 4.3.0 20080428 (Red Hat 4.3.0-8)
Memory: 4k page, physical 529167668k(69283408k free), swap 33554424k(33552380k free)
CommandLine flags: -XX:ConcGCThreads=8 -XX:G1ReservePercent=20 -XX:GCLogFileSize=104857600
-XX:InitialHeapSize=17179869184 -XX:InitiatingHeapOccupancyPercent=45 -XX:MaxGCPauseMillis=100
-XX:MaxHeapSize=17179869184 -XX:NumberOfGCLogFiles=10 -XX:ParallelGCThreads=30
-XX:+PrintAdaptiveSizePolicy -XX:PrintFLSStatistics=2 -XX:+PrintGC -XX:+PrintGCApplicationStoppedTime
-XX:+PrintGCDateStamps -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintHeapAtGC
-XX:+UseCompressedClassPointers -XX:+UseCompressedOops -XX:+UseG1GC -XX:+UseGCLogFileRotation
...
...
2016-04-13T22:06:37.254-0400: 19839.175: [GC concurrent-root-region-scan-start]
2016-04-13T22:06:37.313-0400: 19839.234: [GC concurrent-root-region-scan-end, 0.0592966 secs]
2016-04-13T22:06:37.313-0400: 19839.234: [GC concurrent-mark-start] …Run Code Online (Sandbox Code Playgroud)