相关疑难解决方法(0)

Brendan D. Gregg(DTrace书的作者)有一个有趣的分析变体:"Off-CPU"分析(和Off-CPU Flame Graph ; 幻灯片2013,p112-137),以查看线程或应用程序被阻止的位置(是不是由CPU执行,而是等待I/O,页面故障处理程序或由于CPU资源而导致的计划外停机:

这一次揭示了哪些代码路径在CPU外被阻塞和等待,以及准确的持续时间.这与传统的分析不同,后者通常以给定的间隔对线程的活动进行采样,并且(通常)只检查线程是否在CPU上执行工作.

他还可以将Off-CPU配置文件数据和On-CPU配置文件结合在一起:http://www.brendangregg.com/FlameGraphs/hotcoldflamegraphs.html

Gregg给出的示例是使用的dtrace,这在Linux OS中通常不可用.但是有一些类似的工具(ktap,systemtap,perf)和perf我认为最广泛的安装基础.通常perf生成On-CPU配置文件(这些功能在CPU上执行得更频繁).

如何将Gregg的非CPU示例翻译perf成Linux中的分析工具？

PS:来自LISA13,p124的幻灯片中有关于CPU外部火焰图的systemtap变体的链接:" Yichun Zhang创建了这些,并且已经在Linux上使用SystemTap来收集专业数据.请参阅:• http:// agentzh .org/misc/slides/off-cpu-flame-graphs.pdf " "(2013年8月23日的CloudFlare啤酒会议)

linux profiling wait perf

osg*_*sgx

2014 04-16

13
推荐指数

2
解决办法

3522
查看次数

使用 perf 记录包含睡眠/阻塞时间的配置文件

我想获取我的程序的采样配置文件，其中包括阻塞时间（等待网络服务）以及 CPU 时间。

perf 的默认分析模式 ( perf record -F 99 -g -- ./binary) 对整个系统的运行时间进行采样，但没有明确说明我的程序在程序的哪些部分花费了多少时间：它偏向于 CPU 密集型部分并且不显示 IO 密集型部分。在睡眠时间分析模式（与上SO节目）的睡眠时间，但没有一般的个人资料。

我想要的是一些非常简单的东西：每 10 毫秒记录一次我的程序的调用堆栈，无论它是正在运行还是当前被阻塞。然后用它制作一个火焰图。

linux profiling perf

Chr*_*ger

2017 05-23

5
推荐指数

0
解决办法

1361
查看次数

如何分析 Java 中的阻塞代码 – 测量执行时间而不是 CPU 时间

我正在尝试分析经常在数据库和休息调用中阻塞的情况。该代码不受 cpu 限制。以下示例 junit 方法应该可以说明该问题：

@RepeatedTest(10)
void fast() throws InterruptedException {
    Thread.sleep(100);
}

@RepeatedTest(10)
void slow() throws InterruptedException {
    // imagine a slow database or rest call or any other blocking code
    Thread.sleep(1000);
}

Run Code Online (Sandbox Code Playgroud)

我正在使用 IntelliJ 和 Java Flight Recorder。我预计该方法fast将使用大约 10% 的执行时间，而该方法slow将使用大约 90% 的执行时间。但它们根本没有被报告，因为它们不占用 CPU 时间。

如何分析实际执行时间（包括阻塞代码中的等待时间而不仅仅是 CPU 时间）？

java profiling jfr

bol*_*lin

lucky-day

5
推荐指数

1
解决办法

871
查看次数

gprof和(unix)时间之间的差异; gprof报告较低的运行时间

我有简单的排序程序,我正在分析,以便有一个案例来研究gprof; 我后来计划分析一个更大的算法.

我编译-pg并运行./sort来生成gmon.out文件.但是,当我运行gprof ./sort gmon.out累积秒数和自秒时产生的值时,我认为不准确.

首先,跑步time(./sort)我得到:

real    0m14.352s
user    0m14.330s
sys     0m0.005s

Run Code Online (Sandbox Code Playgroud)

我的秒表准确无误.

但是,平面轮廓的gprof结果是:

Each sample counts as 0.01 seconds.
%   cumulative   self              self     total           
time   seconds   seconds    calls   s/call   s/call  name    
56.18      2.76     2.76        1     2.76     4.71  sort(std::vector<int, std::allocator<int> >&)
35.01      4.49     1.72 1870365596     0.00     0.00  std::vector<int, std::allocator<int> >::operator[](unsigned long)
8.96      4.93     0.44   100071     0.00     0.00  std::vector<int, std::allocator<int> >::size() const
0.00      4.93     0.00    50001     0.00     0.00  __gnu_cxx::new_allocator<int>::construct(int*, int const&)
0.00      4.93 …

Run Code Online (Sandbox Code Playgroud)

c++ profiler profiling g++ gprof

iza*_*aak

2017 05-23

2
推荐指数

1
解决办法

428
查看次数