最近,我们在Java Web应用程序中升级了休眠jar。升级之后,我们发现CPU使用率增加了15-20%。之前和之后的唯一区别是休眠jar版本。我需要确定导致CPU使用率增加的根本原因。我拍摄了jvisualvm cpu profiler快照,并将其转换为火焰图。从两个火焰图可以看出,堆栈跟踪是相同的,但cpu%存在差异。
在升级之前和之后都执行了具有相同用户负载和用例的负载测试。两种应用程序部署之间的唯一区别是休眠jar。一个版本具有休眠4.3.5,另一个版本具有5.4.2。火焰图并没有指出休眠功能是导致CPU使用率增加的原因,因此我对如何继续进行分析感到困惑。
我需要一些指南,以比较两个火焰图并解决CPU使用率增加的根本原因。请在这些链接处找到火焰图。
采样5分钟
之前的火焰图-https: //filebin.net/sxagcfs6lmtie654/old_report_5min.html?t=k4t2i379
之后的火焰图-https: //filebin.net/sxagcfs6lmtie654/report_5min.html?t=k4t2i379
之前的Profiler快照-https://filebin.net/sxagcfs6lmtie654/Old_Hibernate_Sampling_5Minute.nps?t =fvno95sr
之后的探查器快照-https://filebin.net/sxagcfs6lmtie654/New_Hibernate_Sampling_5Minute.nps?t =fvno95sr
采样30分钟
之前的火焰图-https: //filebin.net/sxagcfs6lmtie654/old_report_30min.html?t=ttb7s4k4
之后的火焰图-https: //filebin.net/sxagcfs6lmtie654/report_30min.html?t=ttb7s4k4
之前的Profiler快照-https://filebin.net/sxagcfs6lmtie654/OldHibernateLibrary_30min.nps?t =fvno95sr
之后的探查器快照-https://filebin.net/sxagcfs6lmtie654/LatestHibernateLibrary_30min.nps?t =fvno95sr
比较两个采样会话的一个好方法是比较热方法直方图。可以在VisualVM或以下SJK命令中完成。
sjk ssa --histo --by-term -f OldHibernateLibrary_30min.nps
Trc (%) Frm N Term (%) Frame
64450 53% 64450 64450 53% java.util.concurrent.LinkedBlockingQueue.poll(Unknown Source)
22503 18% 22503 22503 18% sun.nio.ch.SocketChannelImpl.read(Unknown Source)
8954 7% 8954 8954 7% sun.nio.ch.SelectorImpl.select(Unknown Source)
6943 5% 6943 6943 5% java.lang.ClassLoader.loadClass(Unknown Source)
3828 3% 3828 3828 3% java.lang.Thread.sleep(Native Method)
1918 1% 1918 1918 1% java.lang.Object.wait(Native Method)
1674 1% 1674 1674 1% sun.nio.ch.SocketChannelImpl.write(Unknown Source)
...
Trc (%) Frm N Term (%) Frame
60427 44% 60427 60427 44% java.util.concurrent.LinkedBlockingQueue.poll(Unknown Source)
28568 21% 28568 28568 21% java.lang.ClassLoader.loadClass(Unknown Source)
23072 17% 23072 23072 17% sun.nio.ch.SocketChannelImpl.read(Unknown Source)
6181 4% 6181 6181 4% sun.nio.ch.SelectorImpl.select(Unknown Source)
3030 2% 3030 3030 2% java.lang.Thread.sleep(Native Method)
1542 1% 1542 1542 1% sun.nio.ch.SocketChannelImpl.write(Unknown Source)
1451 1% 1451 1451 1% java.util.concurrent.LinkedBlockingQueue.take(Unknown Source)
...
sjk ssa --histo --by-term -f LatestHibernateLibrary_30min.nps
简要浏览直方图,我可以看到java.lang.ClassLoader.loadClass
从5%增长到21%(请注意,这是采样总数的百分之一,它们不会转换为CPU使用率)。
假设两个快照都承受相同的负载(我无法从VisualVM快照验证),那么我可以得出结论,这java.lang.ClassLoader.loadClass
是导致CPU使用率下降的罪魁祸首。
进一步过滤直方图
sjk ssa --histo --by-term -f OldHibernateLibrary_30min.nps -tf java.lang.ClassLoader.loadClass sjk ssa --histo --by-term -f LatestHibernateLibrary_30min.nps -tf java.lang.ClassLoader.loadClass
我看不到新旧版本之间的区别,各版本之间的ei使用模式保持不变。
从柱状图我可以看到所有的路径java.lanf.ClassLoader.loadClass
走,虽然org.springframework.orm.jpa.SharedEntityManagerCreator$SharedEntityManagerInvocationHandler.invoke
,所以问题的路径低于
java.lang.ClassLoader.loadClass(Unknown Source)
org.springframework.util.ClassUtils.isVisible(Unknown Source)
org.springframework.util.ClassUtils.getAllInterfacesForClassAsSet(Unknown Source)
org.springframework.util.ClassUtils.getAllInterfacesForClassAsSet(Unknown Source)
org.springframework.orm.jpa.ExtendedEntityManagerCreator.createProxy(Unknown Source)
org.springframework.orm.jpa.ExtendedEntityManagerCreator.createProxy(Unknown Source)
org.springframework.orm.jpa.ExtendedEntityManagerCreator.createApplicationManagedEntityManager(Unknown Source)
org.springframework.orm.jpa.AbstractEntityManagerFactoryBean.invokeProxyMethod(Unknown Source)
org.springframework.orm.jpa.AbstractEntityManagerFactoryBean$ManagedEntityManagerFactoryInvocationHandler.invoke(Unknown Source)
com.sun.proxy.$Proxy671.createEntityManager(Unknown Source)
com.spmsoftware.appframework.persistence.MultitenantEntityManagerFactory.createEntityManager(Unknown Source)
org.springframework.orm.jpa.SharedEntityManagerCreator$SharedEntityManagerInvocationHandler.invoke(Unknown Source)
结论
VisualVM采样显示增加了java.lanf.ClassLoader.loadClass
方法花费的时间。不幸的是,这是基于线程转储的采样的限制,您无法在本机方法中进行选择。
java.lanf.ClassLoader.loadClass
两种旧的新方法的利用率都很高,这使我想到了框架中的某些通信错误。
java.lanf.ClassLoader.loadClass
高时间可能是线程之间争用的结果,而不是实际的CPU使用率。尽管指标的相对变化使我们有理由考虑它与CPU使用率增长的根本原因有关。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句