相关疑难解决方法(0)

无论编程语言如何,有哪些常见的性能问题？

通常,如果我的代码有任何性能问题,我将按照以下步骤来了解原因.

top命令查看cpu的用法
free命令查看内存使用情况
将时序信息添加到代码中
在代码中打印进度语句
理解并改进算法

如果您的代码运行速度很慢,您会怎么做？

c algorithm performance operating-system data-structures

Boo*_*ean

lucky-day

3
推荐指数

1
解决办法

404
查看次数

简单的操作浪费时间？

我正在寻找一个简单的操作/例程,如果连续重复,可以"浪费"时间.

我正在研究如何将gprof配置文件应用程序,因此这个"浪费时间"需要在用户空间中浪费时间,并且不需要外部库.IE,调用sleep(20)将"浪费"20秒的时间,但gprof不会记录这次,因为它发生在另一个库中.

对于可以重复浪费时间的简单任务的任何建议？

c++ benchmarking profiling gprof

BSc*_*ker

2012 08-09

3
推荐指数

2
解决办法

1723
查看次数

Python分析方法

我想从对象的角度来描述python代码.例如:

foo = Foo()
profiled_foo = add_profiling(foo)

# use profiled_foo like foo
...

# later
profiled_foo.print_profile()

Run Code Online (Sandbox Code Playgroud)

我希望按方法调用每个方法花费的累计时间.我没有发现任何类似的东西,虽然我认为写起来不应该太难.

这样的图书馆存在吗？或者也许不是因为这种方式分析会是一个坏主意？

根据Paul McGuire的回答:

import inspect

from time import sleep
from profilehooks import profile

class Foo(object):
    def a(self):
        sleep(0.1)

    def b(self):
        sleep(0.3)

    def c(self):
        sleep(0.5)

def add_profiling(obj):
    for k in dir(obj):
        attr = getattr(obj, k)
        if inspect.ismethod(attr) and k != '__init__':
            setattr(obj, k, profile(attr))

if __name__ == '__main__':
    foo = Foo()
    add_profiling(foo)

    foo.a()
    foo.a()
    foo.b()
    foo.b()
    foo.a()
    foo.c()

Run Code Online (Sandbox Code Playgroud)

*** PROFILER RESULTS ***
c …

Run Code Online (Sandbox Code Playgroud)

python profiling

tau*_*ran

2011 10-26

3
推荐指数

1
解决办法

2032
查看次数

Oprofile callgraph：系统调用的起源

我一直在使用 oprofile 来尝试找出为什么我的程序在内核中花费如此多的时间。我现在拥有来自内核的符号，但显然我的程序和内核之间没有链接可以告诉我程序的哪些部分花费了这么长时间。

samples  %        image name               app name                 symbol name
-------------------------------------------------------------------------------
  201       0.8911  vmlinux-3.0.0-30-generic vmlinux-3.0.0-30-generic _raw_spin_lock_irq
  746       3.3073  vmlinux-3.0.0-30-generic vmlinux-3.0.0-30-generic rb_get_reader_page
  5000     22.1671  vmlinux-3.0.0-30-generic vmlinux-3.0.0-30-generic default_spin_lock_flags
  16575    73.4838  vmlinux-3.0.0-30-generic vmlinux-3.0.0-30-generic _raw_spin_lock
22469    11.1862  vmlinux-3.0.0-30-generic vmlinux-3.0.0-30-generic __ticket_spin_lock
  22469    99.6010  vmlinux-3.0.0-30-generic vmlinux-3.0.0-30-generic __ticket_spin_lock [self]
  26        0.1153  vmlinux-3.0.0-30-generic vmlinux-3.0.0-30-generic ret_from_intr

Run Code Online (Sandbox Code Playgroud)

我该去哪里？如何发现程序中导致 __ticket_spin_lock 的位置？

linux profiling oprofile

Dij*_*tra

lucky-day

3
推荐指数

1
解决办法

2136
查看次数

如何有效地测量运行时间的差异

TC++ PL中的一个练习要求:

编写一个函数,该函数返回一个值或根据参数抛出该值.测量两种方式之间的运行时差异.

很遗憾他从未解释过如何衡量这些事情.我不确定我是否想要编写简单的"时间开始,时间结束"计数器,还是有更有效和实用的方法？

c++ performance

The*_* do

2010 04-11

2
推荐指数

1
解决办法

413
查看次数

加速IO绑定的OpenGL应用程序

我最近一直在研究一个点云播放器,理想情况下应该能够从激光雷达捕获中可视化地形数据点并以大约30fps的顺序显示它们.然而,我似乎已经因PCI-e IO而陷入困境.

我需要为每一帧做的是加载存储在内存中的大点云,然后根据高度计算颜色图(我使用的东西类似于matlab的喷射图),然后将数据传输到GPU.这适用于云捕获,点数<100万.然而,在大约200万点时,这开始减慢到每秒30帧以下.我意识到这是很多数据(每点200万帧*[每点3个浮点数+每个颜色点3个浮点数]*每个浮点数4个字节*每秒30帧=每秒约1.34千兆字节)

我的渲染代码现在看起来像这样:

glPointSize(ptSize);
glEnableClientState(GL_VERTEX_ARRAY);
if(colorflag) {
    glEnableClientState(GL_COLOR_ARRAY);
} else {
    glDisableClientState(GL_COLOR_ARRAY);
    glColor3f(1,1,1);
}
glBindBuffer(GL_ARRAY_BUFFER, vbobj[VERT_OBJ]);
glBufferData(GL_ARRAY_BUFFER, cloudSize, vertData, GL_STREAM_DRAW);
glVertexPointer(3, GL_FLOAT, 0, 0);
glBindBuffer(GL_ARRAY_BUFFER, vbobj[COLOR_OBJ]);
glBufferData(GL_ARRAY_BUFFER, cloudSize, colorData, GL_STREAM_DRAW);
glColorPointer(3, GL_FLOAT, 0, 0);
glDrawArrays(GL_POINTS, 0, numPoints);
glDisableClientState(GL_VERTEX_ARRAY);
glEnableClientState(GL_COLOR_ARRAY);
glBindBuffer(GL_ARRAY_BUFFER, 0);

Run Code Online (Sandbox Code Playgroud)

每帧都会更改vertData和colorData的指针.

我希望能够做到的是,即使以后使用每帧可能达到700万点的大点云,也能够以每秒至少30帧的速度播放.这甚至可能吗？或者也许更容易网格化并构建高度图并以某种方式显示它？我对3D编程还很陌生,所以任何建议都会受到赞赏.

opengl 3d optimization performance lidar

Xzh*_*hsh

2013 03-18

2
推荐指数

1
解决办法

593
查看次数