标签: lapack

bunzip2 -c atlas3.10.1.tar.bz2 | tar xfm -    # create SRCdir
mv ATLAS ATLAS3.10.1                          # get unique dir name
cd ATLAS3.10.1                                # enter SRCdir
mkdir Linux_C2D64SSE3                         # create BLDdir
cd Linux_C2D64SSE3                            # enter BLDdir
../configure -b 64 -D c -DPentiumCPS=2400 \   # configure command
  --prefix=/home/whaley/lib/atlas \           # install dir
  --with-netlib-lapack-tarfile=/home/whaley/dload/lapack-3.4.2.tgz
make build                                    # tune & build lib
make check                                    # sanity check correct answer
make ptcheck                                  # sanity check parallel
make time                                     # …

Run Code Online (Sandbox Code Playgroud)

linux lapack

bar*_*hen

2013 03-01

4
推荐指数

1
解决办法

8518
查看次数

在打包存储和完整存储之间转换对称矩阵？

我是数值线性代数的新手，我刚刚开始使用 LAPACK 和 BLAS。

是否有可以在打包存储和完整存储之间复制/转换对称矩阵的例程？

我发现了dtrttp，我可以用它来将双精度全对称矩阵转换为压缩存储。但是，这些例程适用于三角形矩阵，因此相应的dtpttr仅填充完整矩阵的三角形。我怎样才能填满另一半？

blas lapack

KQS*_*KQS

2015 02-12

4
推荐指数

1
解决办法

1235
查看次数

numpy.disutils.system_info.NotFoundError：未找到 lapack/blas 资源

问题：将 numpy 链接到更正的线性代数库。过程太复杂了，我可能会第 6 次寻找解决方案，但我不知道出了什么问题。我在 Ubuntu 12.04.5 上。我重新安装了 blas 和 lapack，然后使用 pip 重新安装了 numpy。我在系统环境中这样做，然后也在 virtualenv 环境中尝试。所有的事情似乎都没有奏效。

这是我的numpy.__config__.show()：

lapack_info:
  NOT AVAILABLE
lapack_opt_info:
  NOT AVAILABLE
openblas_lapack_info:
  NOT AVAILABLE
blas_info:
  NOT AVAILABLE
atlas_3_10_blas_threads_info:
  NOT AVAILABLE
atlas_threads_info:
  NOT AVAILABLE
blas_src_info:
  NOT AVAILABLE
atlas_3_10_threads_info:
  NOT AVAILABLE
atlas_blas_info:
  NOT AVAILABLE
atlas_3_10_blas_info:
  NOT AVAILABLE
lapack_src_info:
  NOT AVAILABLE
atlas_blas_threads_info:
  NOT AVAILABLE
openblas_info:
  NOT AVAILABLE
blas_mkl_info:
  NOT AVAILABLE
blas_opt_info:
  NOT AVAILABLE
atlas_info:
  NOT AVAILABLE
atlas_3_10_info:
  NOT AVAILABLE
lapack_mkl_info:
  NOT AVAILABLE
mkl_info:
  NOT AVAILABLE

Run Code Online (Sandbox Code Playgroud)

这是一个非常常见的错误，根据用户的环境和历史有很多解决方案。我最近按照此处的说明完成了安装 BLAS 和 LAPACK …

python ubuntu numpy blas lapack

pg2*_*455

2017 05-23

4
推荐指数

2
解决办法

9502
查看次数

LAPACK和BLAS的高性能版本是什么？

IMSL 的这一页说

为了获得改进的性能，我们建议链接 LAPACK 和 BLAS 的高性能版本（如果可用）。

什么是 LAPACK 和 BLAS 的高性能版本？

blas lapack

use*_*964

lucky-day

4
推荐指数

1
解决办法

2399
查看次数

LAPACK 例程中的 WORK 参数有什么用？

我正在计算对称矩阵的特征值分解scipy.linalg.cython_lapack.syev。从我发现的文档中，我需要传递一个名为 WORK 的数组：

WORK 是 DOUBLE PRECISION 数组，维度 (MAX(1,LWORK)) 在退出时，如果 INFO = 0，WORK(1) 返回最佳 LWORK。

但是，我看不到它的作用（无法理解执行后的值是什么），也看不到它的用途。这个参数的目的是什么？

python cython lapack lapacke

P. *_*eri

lucky-day

4
推荐指数

1
解决办法

830
查看次数

GPU 上的 NumPy + BLAS + LAPACK（AMD 和 Nvidia）

我们有一个 Python 代码，其中涉及昂贵的线性代数计算。数据存储在 NumPy 数组中。该代码使用 numpy.dot 以及一些 BLAS 和 LAPACK 函数，当前可通过 scipy.linalg.blas 和 scipy.linalg.lapack 访问这些函数。当前代码是为CPU编写的。我们想要转换代码，以便一些 NumPy、BLAS 和 LAPACK 操作在 GPU 上执行。

我正在尝试确定执行此操作的最佳方法。据我所知，Numba 不支持 GPU 上的 BLAS 和 LAPACK 函数。看来 PyCUDA 可能是最佳途径，但我无法确定 PyCUDA 是否允许同时使用 BLAS 和 LAPACK 函数。

编辑：我们需要将代码移植到不同的 GPU 架构，包括 AMD 和 Nvidia。虽然 PyCUDA 似乎提供了所需的功能，但 CUDA（以及 PyCUDA）无法在 AMD GPU 上运行。

python numpy blas lapack

src*_*rer

2018 01-17

4
推荐指数

1
解决办法

2642
查看次数

用 OpenCL C 编写快速线性系统求解器

我正在编写一个 OpenCL 内核，它将涉及解决一个线性系统。目前我的内核太慢了，提高线性系统部分的性能似乎是一个很好的起点。

我还应该注意，我并不是要让我的线性求解器平行，我正在处理的问题在宏观层面上已经令人尴尬地平行了。

以下是我为使用部分旋转的高斯消元法求解 Ax=b 而编写的 C 代码，

#import <stdio.h>
#import <math.h>
#import <time.h>

#define K 50

// Solve the system Ax=b using Gaussian elimination with partial pivoting.
void linear_solve(float A[K * K], float b[K])
{
    for (long j=0; j<K; j++)
    {
        // Begin partial pivoting.
        float maxval = fabs(A[K * j + j]);

        long maxrow = j;

        for (long i=j+1; i<K; i++)
        {
            if (fabs(A[K * j + i]) > maxval)
            {
                maxval = fabs(A[K * j + …

Run Code Online (Sandbox Code Playgroud)

c performance opencl lapack julia

Tho*_*oth

2020 07-04

4
推荐指数

1
解决办法

206
查看次数

使用LAPACK包装器估算行列式,以便在Cython中进行LU分解

我在这里定义了计算矩阵行列式的函数.但有时我会得到错误的信号.我从这个答案中建模了我的功能.

from scipy.linalg.cython_lapack cimport dgetrf

cpdef double det_c(double[:, ::1] A, double[:, ::1] work, double[::1] ipiv):
    '''obtain determinant of float type square matrix A

    Notes
    -----
    As is, this function is not yet computing the sign of the determinant
    correctly, help!

    Parameters
    ----------
    A : memoryview (numpy array)
        n x n array to compute determinant of
    work : memoryview (numpy array)
        n x n array to use within function
    ipiv : memoryview (numpy array)
        length n vector use within …

Run Code Online (Sandbox Code Playgroud)

python numpy cython scipy lapack

jto*_*rca

lucky-day

3
推荐指数

1
解决办法

161
查看次数