相关疑难解决方法(0)

使用OpenBLAS集成编译numpy

我试图安装numpyOpenBLAS,但我在损失的如何site.cfg文件需要被写入.

在遵循安装过程时,安装完成且没有错误,但是将OpenBLAS使用的线程数从1增加(由环境变量OMP_NUM_THREADS控制)会导致性能下降.

我不确定OpenBLAS集成是否完美.任何人都可以提供一个site.cfg文件来实现相同的目标.

PS:OpenBLAS集成在其他工具包中,比如基于Python的Theano,可以在同一台机器上增加线程数量,从而大幅提升性能.

python numpy blas atlas

50
推荐指数
3
解决办法
4万
查看次数

计算矢量v矩阵的"v ^ TA v"

我有一个k*n矩阵X和一个k*k矩阵A.对于每一列X,我想计算标量

X[:, i].T.dot(A).dot(X[:, i])
Run Code Online (Sandbox Code Playgroud)

(或者,数学上Xi' * A * Xi).

目前,我有一个for循环:

out = np.empty((n,))
for i in xrange(n):
    out[i] = X[:, i].T.dot(A).dot(X[:, i])
Run Code Online (Sandbox Code Playgroud)

但是因为n很大,我想尽可能快地做到这一点(即使用一些NumPy函数而不是循环).

numpy

7
推荐指数
2
解决办法
1910
查看次数

标签 统计

numpy ×2

atlas ×1

blas ×1

python ×1