相关疑难解决方法(0)

基准测试(python与使用BLAS的c ++)和(numpy)

我想编写一个广泛使用BLAS和LAPACK线性代数功能的程序.由于性能是一个问题,我做了一些基准测试,并想知道,如果我采取的方法是合法的.

可以说,我有三位参赛者,他们希望用简单的矩阵矩阵乘法来测试他们的表现.参赛者是:

Numpy,仅使用其功能dot.
Python,通过共享对象调用BLAS功能.
C++,通过共享对象调用BLAS功能.

脚本

我为不同的维度实现了矩阵 - 矩阵乘法i.i为5的增量和matricies运行5-500 m1和m2设置了这样的:

m1 = numpy.random.rand(i,i).astype(numpy.float32)
m2 = numpy.random.rand(i,i).astype(numpy.float32)

Run Code Online (Sandbox Code Playgroud)

Numpy

使用的代码如下所示:

tNumpy = timeit.Timer("numpy.dot(m1, m2)", "import numpy; from __main__ import m1, m2")
rNumpy.append((i, tNumpy.repeat(20, 1)))

Run Code Online (Sandbox Code Playgroud)

2. Python,通过共享对象调用BLAS

有了这个功能

_blaslib = ctypes.cdll.LoadLibrary("libblas.so")
def Mul(m1, m2, i, r):

    no_trans = c_char("n")
    n = c_int(i)
    one = c_float(1.0)
    zero = c_float(0.0)

    _blaslib.sgemm_(byref(no_trans), byref(no_trans), byref(n), byref(n), byref(n), 
            byref(one), m1.ctypes.data_as(ctypes.c_void_p), byref(n), 
            m2.ctypes.data_as(ctypes.c_void_p), byref(n), byref(zero), 
            r.ctypes.data_as(ctypes.c_void_p), byref(n))

Run Code Online (Sandbox Code Playgroud)

测试代码如下所示:

r = …

Run Code Online (Sandbox Code Playgroud)

c++ python benchmarking numpy blas

Wol*_*tan

2011 10-21

105
推荐指数

4
解决办法

4万
查看次数

为什么NumPy阵列如此之快？

我刚刚改变了一个我正在编写的程序,将我的数据保存为numpy数组,因为我遇到了性能问题,而且差别很大.它最初运行需要30分钟,现在需要2.5秒!

我想知道它是如何做到的.我认为是因为它消除了对for循环的需要但超出了我的难度.

python arrays numpy

Ana*_*ake

2017 04-25

53
推荐指数

3
解决办法

3万
查看次数

为什么天真的C++矩阵乘法比BLAS慢100倍？

我正在研究大型矩阵乘法并运行以下实验来形成基线测试:

从std normal(0 mean,1 stddev)随机生成两个4096x4096矩阵X,Y.
Z = X*Y.
Z的Sum元素(以确保它们被访问)和输出.

这是天真的C++实现:

#include <iostream>
#include <algorithm>

using namespace std;

int main()
{
    constexpr size_t dim = 4096;

    float* x = new float[dim*dim];
    float* y = new float[dim*dim];
    float* z = new float[dim*dim];

    random_device rd;
    mt19937 gen(rd());
    normal_distribution<float> dist(0, 1);

    for (size_t i = 0; i < dim*dim; i++)
    {
        x[i] = dist(gen);
        y[i] = dist(gen);
    }

    for (size_t row = 0; row < dim; row++)
        for (size_t col = 0; col < …

Run Code Online (Sandbox Code Playgroud)

c++ linux matlab matrix-multiplication c++11

And*_*zos

2013 11-26

12
推荐指数

2
解决办法

3347
查看次数