Ped*_*dro 3 blas accelerate-framework
我正在尝试使用vecLibs的cblas将两个矩阵相乘:
#include <stdlib.h>
#include <string.h>
#include <stdio.h>
#include <vecLib/cblas.h>
int main (void) {
float *A = malloc(sizeof(float) * 2 * 3);
float *B = malloc(sizeof(float) * 3 * 1);
float *C = malloc(sizeof(float) * 2 * 1);
cblas_sgemm(CblasRowMajor,
CblasNoTrans,
CblasNoTrans,
2,
1,
3,
1.0,
A, 2,
B, 3,
0.0,
C, 2);
printf ("[ %f, %f]\n", C[0], C[1]);
return 0;
}
Run Code Online (Sandbox Code Playgroud)
根据文档,每个参数似乎都匹配,但出现此错误:
lda必须> = MAX(K,1):lda = 2 K = 3BLAS错误:传递给cblas_sgemm的参数编号9的值无效
在我看来,您看到的错误似乎完全正确。
LDA始终是线性存储器中阵列A的间距。如果使用行主要存储顺序,则间距将是列数,而不是行数。因此,在这种情况下,LDA应该为3。
| 归档时间: |
|
| 查看次数: |
1397 次 |
| 最近记录: |