系统GC的采样
1: 在WebSphere Administrative Console上, 点击进入:Servers, 然后Application servers > server1 > Process Definition > Java Virtual Machine, 在Configuration面板上,选上Verbose garbage collection选项。
图二 WebSphere Application Server的JVM配置示图
2:进入<%WebSphere Application Server的安装目录%>/profiles/<%所在的profiles%>/logs/ <%所在的Server%>, 可以看到native_stderr.log文件,将其清空
3:在高负载的条件下,进行高压测试3分钟
4:将native_stderr.log文件拷贝出来,用GCCollector工具进行分析,其中native_stderr.log文件上记录了系统GC的数据。
5:安装GCCollector工具: 下载完GCCollector.zip后,解压缩,将里面Lib里的3个文件 jfreechart-1.0.0-rc1.jar,jcommon-1.0.0-rc1.jar 和GCCollector.jar拷贝至JRE的lib目录下,然后在命令行控制台上进入JRE的安装目录,而后运行: java -classpath jfreechart-1.0.0-rc1.jar;jcommon-1.0.0-rc1.jar -jar GCCollector.jar。
接着可以看到GCCollector的用户界面,在它的Parser菜单中选择JRE的版本,而后在File菜单中选择并打开刚才拷出的native_stderr.log文件。
下图是在高负载情况下,系统在当前配置下的GC分析图。
图三 系统的GC分析图
由图三可以看出,系统没有内存泄漏的现象,每次GC所花的时间为220ms左右,从GCCollector的Spreadsheet可以查到,GC的时间周期为5-6 s,每次具体GC发生的时间,每次GC所花的时间。
6:同样遵循Nyquist采样定例,对GC进行采样,采样后的数据同任务池中Q值的采样数据进行比较和分析,得出两者之间存在着密切的关系。下图为任务池Q值和GC数据采样分析图,由图中可以看出,每次任务池的Q值大幅度增长时,系统刚好发生GC。二者的时间和周期几乎可以完全匹配。 因此可以初步下一个结论,由于系统的GC,导致了系统在某些时刻不能有足够的能力来处理请求,因此任务池的Q值在这些时候会因为任务的大量累积而巨幅涨大,即而超出限额的任务被流控所清除,导致了在超负荷下任务请求成功率不是很理想。
图四 任务池Q值和GC数据采样分析图

