Win*_*hen 24 java performance profiling
是否有任何推荐的Java应用程序分析教程?
我正在使用JProfiler和Eclipse 测试和性能工具平台(TPTP)进行分析.然而,虽然配备了精彩的武器,作为Java新概要的新手,我仍然缺少指出瓶颈的一般理论和技巧.
Mik*_*vey 39
剖析是一门具有不止一种思想流派的学科.
更受欢迎的是你进行测量.也就是说,您尝试查看每个函数需要多长时间和/或调用它的次数.显然,如果一个函数花费很少的时间,那么加速它将获得很少的收益.但是如果需要花费很多时间,那么你必须做一些侦探工作来弄清楚功能的哪个部分对时间负责.不要指望函数时间加起来总时间,因为函数互相调用,而函数A可能需要花费很多时间的原因是它调用函数B也需要花费很多时间.
这种方法可以找到很多问题,但这取决于你是一个好侦探,能够清楚地思考不同的时间,如挂钟时间与CPU时间,以及自我时间与包容时间.例如,应用程序可能看起来很慢,但功能时间可能都报告为接近零.这可能是程序受I/O限制造成的.如果I/O是您期望的,那可能没什么问题,但它可能正在做一些您不了解的I/O,然后您又回到了侦探工作.
对分析器的一般期望是,如果你可以修复足够的东西以获得10%或20%的加速,这是相当不错的,而且我从来没有听说过重复使用分析器的故事,以获得比这更多的加速.
另一种方法不是衡量,而是捕捉.它的基础是,在程序花费的时间比你想要的更长时间(在挂钟时间内),你想要知道它在做什么,主要是,并找到一种方法是阻止它并询问,或者对其状态进行快照并对其进行分析,以便完全了解它正在做什么,以及为什么它会在特定时间点进行.如果您多次执行此操作并且您看到它多次尝试执行的操作,那么您可以有效地优化该活动.不同之处在于你没有问多少 ; 你在问什么和为什么.这是另一种解释.(请注意,拍摄这样快照的速度并不重要,因为你不是在询问时间,而是在询问程序正在做什么以及为什么.)
在Java的情况下,这是一种低技术但非常有效的方法,或者您可以使用Eclipse中的"暂停"按钮.另一种方法是使用特定类型的分析器,一个对整个调用堆栈进行采样,在挂钟时间(不是CPU,除非你想对I/O无视),当你想要它进行采样时(例如,不是在等待用户输入时),并在代码行级别汇总,而不仅仅是功能级别和时间百分比,而不是绝对时间.为了获得时间的百分比,它应该告诉您,对于任何样本上出现的每行代码,包含该行的样本的百分比,因为如果您可以使该行消失,您将保存该百分比.(你应该忽略它试图告诉你的其他事情,比如调用图,递归和自我时间.)很少有分析符符合这个规范,但有一个是RotateRight/Zoom,但我不确定它是否适用于Java,可能还有其他人.
在某些情况下,在实际缓慢的时候,可能很难在需要时获取堆栈样本.然后,由于您所追求的是百分比,您可以对代码执行任何操作,以便在不改变百分比的情况下更轻松地获取样本.一种方法是通过在其周围包裹一个临时循环(例如100次迭代)来放大代码.另一种方法是在调试器下设置数据更改断点.这将导致代码被解释为比正常情况慢10-100倍.另一种方法是使用闹钟定时器在慢速期间关闭,并使用它来抓取样本.
使用捕获技术,如果您反复使用它来查找和执行多个优化,您可以期望达到接近最佳的性能.在大型软件的情况下,瓶颈更多,这可能意味着重要因素.Stack Overflow上的人报告了从7倍到60倍的因素.这是43x的详细示例.
捕获技术遇到的问题是很难找出线程在等待的原因,例如等待事务在另一个处理器上完成时.(测量有同样的问题.)在这些情况下,我使用一种费力的方法来合并带时间戳的日志.
作为剖析的新手,您应该从简单地寻找运行时间长和/或在典型使用模式/出现瓶颈的地方多次调用的方法开始。
由于主要使用NetBeans,因此我不确定Eclipse与JProfiler集成的工作方式。但是,在NetBeans中,有一个“快照”视图,其中显示了方法调用的层次结构,其运行时总计为100%。我寻找层次结构中占(相对)总时间百分比较大的部分。从那里,您必须考虑这些方法在做什么,以及可能导致它们变慢的原因。
例如:我注意到一个经常被调用的方法花费了太多时间来完成,并且是一个严重的瓶颈。长话短说,事实证明代码正在使用该.contains()
方法检查集合中是否存在某个项目,并且该集合是链接列表。这是有问题的原因是因为链表的函数的时间复杂度为O(n).contains()
。这种情况下的修复非常简单,因为我可以用.contains()
O(1)时间执行速度更快的哈希集替换链接列表。
归档时间: |
|
查看次数: |
15538 次 |
最近记录: |