vecLib cblas_sgemm文档错误?

Ped*_*dro 3 blas accelerate-framework

我正在尝试使用vecLibs的cblas将两个矩阵相乘:

#include <stdlib.h>
#include <string.h>
#include <stdio.h>

#include <vecLib/cblas.h>

int main (void) {

    float *A = malloc(sizeof(float) *  2 * 3);
    float *B = malloc(sizeof(float) *  3 * 1);
    float *C = malloc(sizeof(float) *  2 * 1);

    cblas_sgemm(CblasRowMajor, 
                CblasNoTrans,
                CblasNoTrans, 
                2,
                1,
                3,
                1.0,
                A, 2,
                B, 3,
                0.0,
                C, 2);

    printf ("[ %f, %f]\n", C[0], C[1]);

    return 0;  
}
Run Code Online (Sandbox Code Playgroud)

根据文档,每个参数似乎都匹配,但出现此错误:

lda必须> = MAX(K,1):lda = 2 K = 3BLAS错误:传递给cblas_sgemm的参数编号9的值无效

tal*_*ies 5

在我看来,您看到的错误似乎完全正确。

LDA始终是线性存储器中阵列A的间距。如果使用行主要存储顺序,则间距将是列数,而不是行数。因此,在这种情况下,LDA应该为3。

  • 文档说的是正确的 - lda 是矩阵 A *在线性内存中*的第一维。冒号后面的内容适用于列主要订单情况。 (2认同)