Jak*_*zer 145 c++ optimization profiler qt profiling
日期是12/02/10.圣诞节前几天正在逐渐消失,作为一名Windows程序员,我几乎成了一个重要的障碍.我一直在使用AQTime,我已经尝试过困,有光泽,而且非常困,正如我们所说,VTune正在安装.我曾尝试使用VS2008探测器,它一直在积极惩罚,而且经常无法察觉.我使用了随机暂停技术.我检查了呼叫树.我已经解雇了函数跟踪.但令人痛苦的事实是,我正在使用的应用程序超过一百万行代码,可能还有另外一百万行的第三方应用程序.
我需要更好的工具. 我已经阅读了其他主题. 我已经尝试了每个主题中列出的每个分析器.只需要比这些垃圾和昂贵的选择更好的东西,或几乎没有收获的荒谬工作.为了使问题更加复杂,我们的代码经过严格的线程化,并运行了许多Qt事件循环,其中一些非常脆弱,以至于由于时序延迟而导致重负荷仪表崩溃.不要问我为什么我们运行多个事件循环.没有人能告诉我.
在Windows环境中,Valgrind还有更多选择吗?
有没有什么比我已经尝试过的大量破碎工具更好的了?
是否有任何旨在与Qt集成的东西,也许是在队列中有用的事件显示?
我尝试过的工具的完整列表,以及斜体中非常有用的工具:
我没试过的建议工具:
备注:目前 英特尔环境.VS2008,提升库.Qt 4+.他们所有人的悲惨态度:通过trolltech进行Qt/MFC整合.
概要
在许多其他问题中,最近已将许多组件切换到不正确的线程模型,由于我们下面的代码突然不再是多线程的,因此导致严重的挂起.我不能说更多,因为它违反了我的保密协议,但我可以告诉你,通过临时检查甚至正常的代码审查都不会发现这种情况.如果没有分析器,调用图和随机暂停,我们仍然会在美丽的蓝色天空中尖叫着我们的愤怒.值得庆幸的是,我与一些我见过的最好的黑客合作,我可以获得一个充满伟大工具和优秀人才的惊人"诗歌.
Gentlefolk,我非常欣赏这一点,并且唯一的遗憾是我没有足够的代表来奖励你们每个人.我仍然认为这是一个重要的问题,要比我们到目前为止得到的更好的答案.
结果,在接下来的三个星期的每周,我将提供我能负担得起的最大奖金,并用我认为不是常识的最好的工具授予它答案.三个星期后,如果你原谅我的惩罚,我们希望已经积累了一些关于剖析器的确切概况.
外卖
使用分析器.他们对Ritchie,Kernighan,Bentley和Knuth来说已经足够了.我不在乎你认为你是谁.使用分析器.如果你得到的那个不起作用,找另一个.如果你找不到一个,代码一.如果你不能编码一个,或者它是一个小挂机,或者你只是卡住,使用随机暂停.如果一切都失败了,请聘请一些研究生来敲打一个剖析器.
现在,我不得不说我不认为在W7x64环境中分析C++代码有一个明确的选择,但肯定有一些选项无法执行任何有用的服务.
def*_*ode 64
时间采样分析器比CPU采样分析器更强大.我对Windows开发工具并不是很熟悉,所以我不知道哪些是哪种.大多数分析器都是CPU采样.
CPU采样分析器每N条指令抓取一次堆栈跟踪.
此技术将揭示代码中受CPU限制的部分代码.如果这是您应用程序中的瓶颈,那就太棒了.如果您的应用程序线程花费大部分时间来争用互斥锁,那就不那么好了.
时间采样分析器每N微秒抓取一次堆栈跟踪.
这种技术将归零"慢"代码.原因是否是CPU绑定,阻止IO绑定,互斥绑定或缓存颠簸部分代码.简而言之,任何一段代码都会减慢你的应用程序的速度.
因此,如果可能的话,特别是在分析线程代码时,请使用时间采样分析器.
采样分析器生成大量数据.这些数据非常有用,但通常有太多不易使用的数据.配置文件数据可视化器在这里有很大帮助.我发现的用于配置文件数据可视化的最佳工具是gprof2dot.不要让这个名字欺骗你,它会处理各种采样分析器输出(AQtime,Sleepy,XPerf等).一旦可视化指出了违规函数,就跳回到原始配置文件数据,以获得有关真实原因的更好提示.
gprof2dot工具生成点图描述,然后将其输入graphviz工具.输出基本上是一个调用图,其功能颜色由它们对应用程序的影响进行编码.
一些提示让gprof2dot生成好的输出.
--skew
在图表上使用0.001,这样我就可以轻松看到热门代码路径.否则int main()
占主导地位.--strip
.Boost尤其如此.malloc
就是捣乱堆积并且吃掉了15%.Mik*_*vey 16
当你尝试随机暂停时发生了什么?我一直在怪物应用程序上使用它.你说它没有提供足够的信息,你建议你需要高分辨率.有时人们需要一些帮助才能理解如何使用它.
在VS下,我所做的是配置堆栈显示,因此它不会向我显示函数参数,因为这会使堆栈显示完全不可读,IMO.
然后,在让我等待的时候,我会通过点击"暂停"来拍摄大约10个样本.我使用^ A,^ C和^ V将它们复制到记事本中,以供参考.然后我研究每一个,试图找出当时试图完成的过程.
如果它试图在2个或更多样本上完成某些事情,并且那个事情并不是绝对必要的话,那么我发现了一个现实问题,而且我大致知道修复它会节省多少.
有些事情你并不真正需要知道,像精确的百分比并不重要,什么那张里面的第三方代码并不重要,因为你不能做任何事情的.你可以做一些事情是一套丰富的代码调用点,你可以在每个堆栈样品修改显示.那是你快乐的狩猎场.
我发现的事物的例子:
在启动期间,在尝试从DLL资源中提取国际化字符串的过程中,它可以是大约30层深.如果检查实际的字符串,很容易发现字符串实际上不需要国际化,就像它们是用户从未真正看到的字符串一样.
在正常使用期间,某些代码无意中在某个对象中设置了Modified属性.该对象来自一个超类,它捕获变化并触发通知,这些通知在整个数据结构中波动,操纵UI,以难以预见的方式创建和消除对象.这可能会发生很多 - 通知的意外后果.
逐行填写工作表,逐个单元格.事实证明,如果您从一组值中一次性构建行,则速度要快得多.
PS如果你是多线程的,当你暂停它时,所有线程都会暂停.看一下每个线程的调用堆栈.机会是,其中只有一个是真正的罪魁祸首,其他人都是空转.
我在AMD CodeAnalyst上取得了一些成功.
你有MFC OnIdle功能吗?在过去,我有一个近乎实时的应用程序,我必须修复,当设置为19.2K的速度,PentiumD应该能够跟上时,丢弃串行数据包.OnIdle功能就是杀人的东西.我不确定QT是否有这个概念,但我也会检查它.
归档时间: |
|
查看次数: |
10071 次 |
最近记录: |