标签: benchmarking

 matrix mult_std(matrix a, matrix b) {
 matrix c(a.dim(), false, false);
 for (int i = 0; i < a.dim(); i++)
  for (int j = 0; j < a.dim(); j++) {
   int sum = 0;
   for (int k = 0; k < a.dim(); k++)
    sum += a(i,k) * b(k,j);
   c(i,j) = sum;
  }

 return c;
}

Run Code Online (Sandbox Code Playgroud)

编辑

我纠正了我的问题!我在下面添加了完整的源代码并尝试了一些建议:

交换k和j循环迭代 - >性能改进
声明dim()并operator()() 作为inline- >性能改进
通过const引用传递参数 - > 性能损失!为什么？所以我不使用它.

现在的表现与现在的表现几乎相同.也许应该有一点改进. …

c++ arrays benchmarking matrix-multiplication

mul*_*lle

2017 03-13

17
推荐指数

3
解决办法

2万
查看次数

基准测试,代码重新排序,易失性

我决定要对特定函数进行基准测试,所以我天真地编写如下代码:

#include <ctime>
#include <iostream>

int SlowCalculation(int input) { ... }

int main() {
    std::cout << "Benchmark running..." << std::endl;
    std::clock_t start = std::clock();
    int answer = SlowCalculation(42);
    std::clock_t stop = std::clock();
    double delta = (stop - start) * 1.0 / CLOCKS_PER_SEC;
    std::cout << "Benchmark took " << delta << " seconds, and the answer was "
              << answer << '.' << std::endl;
    return 0;
}

Run Code Online (Sandbox Code Playgroud)

一位同事指出,我应该声明start和stop变量volatile以避免代码重新排序.他建议优化器可以,例如,有效地重新排序代码,如下所示:

    std::clock_t start = std::clock();
    std::clock_t stop = …

Run Code Online (Sandbox Code Playgroud)

c++ benchmarking volatile compiler-optimization

Adr*_*thy

2017 05-23

17
推荐指数

1
解决办法

4121
查看次数

准确测试Pypy与CPython的表现

问题描述:

我有这个自定义"校验和"功能:

NORMALIZER = 0x10000


def get_checksum(part1, part2, salt="trailing"):
    """Returns a checksum of two strings."""

    combined_string = part1 + part2 + " " + salt if part2 != "***" else part1
    ords = [ord(x) for x in combined_string]

    checksum = ords[0]  # initial value

    # TODO: document the logic behind the checksum calculations
    iterator = zip(ords[1:], ords)
    checksum += sum(x + 2 * y if counter % 2 else x * y
                    for counter, (x, y) in enumerate(iterator))
    checksum %= …

Run Code Online (Sandbox Code Playgroud)

python performance benchmarking pypy

ale*_*cxe

2017 05-23

17
推荐指数

1
解决办法

672
查看次数

是jQuery的:第一个和:eq(0)选择器功能相同吗？

我不确定是使用:first还是:eq(0)选择器.我很确定他们总会返回相同的物体,但比另一个更快？

我相信这里的某人必须先对这些选择器进行基准测试,而且我不确定测试一个是否更快的最佳方法.

更新:这是我跑的替补席:

/* start bench */
for (var count = 0; count < 5; count++) {
    var i = 0, limit = 10000;
    var start, end;
    start = new Date();
    for (i = 0; i < limit; i++) {
        var $radeditor = $thisFrame.parents("div.RadEditor.Telerik:eq(0)");
    }
    end = new Date();
    alert("div.RadEditor.Telerik:eq(0) : " + (end-start));
    var start = new Date();
    for (i = 0; i < limit; i++) {
        var $radeditor = $thisFrame.parents("div.RadEditor.Telerik:first");
    }
    end = new …

Run Code Online (Sandbox Code Playgroud)

benchmarking jquery jquery-selectors

tra*_*vis

2011 11-08

16
推荐指数

3
解决办法

8351
查看次数

我可以在现有数据库上使用mysqlslap吗？

我可以使用mysqlslap来测试特定的数据库/表吗？或者只是mysqlslap数据库？

谢谢

mysql benchmarking stress-testing

Ale*_*and

2013 08-11

16
推荐指数

1
解决办法

7882
查看次数

qemu vs qemu-kvm:一些性能测量

我在qemu和qemu-kvm中进行了以下基准测试,具有以下配置:

CPU: AMD 4400 process dual core with svm enabled, 2G RAM
Host OS: OpenSUSE 11.3 with latest Patch, running with kde4
Guest OS: FreeDos
Emulated Memory: 256M
Network: Nil
Language: Turbo C 2.0
Benchmark Program: Count from 0000000 to 9999999. Display the counter on the screen
     by direct accessing the screen memory (i.e. 0xb800:xxxx)

Run Code Online (Sandbox Code Playgroud)

在qemu中运行时只需要6秒.

但是在qemu-kvm中运行需要89秒.

我一个接一个地运行基准测试,而不是并行测试.

我整晚都摸不着头脑,但仍然不知道为什么会这样.有人会给我一些提示吗？

performance benchmarking kvm qemu virtual-machine

bio*_*om2

2014 02-05

16
推荐指数

2
解决办法

7910
查看次数

为什么python的for循环对于大输入如此非线性？

我正在对一些python代码进行基准测试,我注意到了一些奇怪我使用以下函数来测量迭代空for循环所需的速度:

def f(n):
    t1 = time.time()
    for i in range(n):
        pass
    print(time.time() - t1)

Run Code Online (Sandbox Code Playgroud)

f(10**6)打印about 0.035,f(10**7)about 0.35,f(10**8)about 3.5和f(10**9)about 35.但是f(10**10)？好吧2000.这当然是意料之外的.为什么迭代10倍的元素需要花费60倍的时间？什么是python的for循环导致这个？这是特定于python的,还是会出现在很多语言中？

benchmarking for-loop python-3.x

use*_*473

2015 02-23

16
推荐指数

2
解决办法

675
查看次数

数组与切片:访问速度

这个问题是关于访问数组和切片元素的速度,而不是关于将它们作为参数传递给函数的效率.

在大多数情况下,我希望数组比切片更快,因为切片是描述数组的连续部分的数据结构,因此在访问切片的元素时可能会涉及额外的步骤(间接地是其底层数组的元素) .

所以我写了一个小测试来测试一批简单的操作.有4个基准函数,前2个测试全局切片和全局数组,另外2个测试局部切片和本地数组:

var gs = make([]byte, 1000) // Global slice
var ga [1000]byte           // Global array

func BenchmarkSliceGlobal(b *testing.B) {
    for i := 0; i < b.N; i++ {
        for j, v := range gs {
            gs[j]++; gs[j] = gs[j] + v + 10; gs[j] += v
        }
    }
}

func BenchmarkArrayGlobal(b *testing.B) {
    for i := 0; i < b.N; i++ {
        for j, v …

Run Code Online (Sandbox Code Playgroud)

arrays performance benchmarking go slice

icz*_*cza

2015 06-17

16
推荐指数

2
解决办法

3420
查看次数