小编Fr3*_*34K的帖子

共享内存带宽Fermi vs Kepler GPU

在访问共享内存时,Kepler的费用是Fermi的2倍还是4倍？

编程指南说明:"每个存储区每两个时钟周期带宽为32位"(对于2.X),"每个存储区的每个时钟周期带宽为64位"(3.X),因此暗示了4倍？

cuda gpu gpgpu nvidia

P M*_*cki

2012 09-11

9
推荐指数

1
解决办法

2940
查看次数

Linux 上的 AVX 分段错误

我正在尝试运行此代码，并且在运行时显示分段错误。它编译得很好。这是代码。（它在 Windows 上运行良好）。

#include<iostream>
#include<vector>
#include<immintrin.h>

const int size = 1000000;

std::vector<float>A(size);
std::vector<float>B(size);
std::vector<float>C(size);

void bar(int i){
    const float a = 2.0f;
    __m256 _a = _mm256_broadcast_ss(&a);
    __m256 _A = _mm256_load_ps(&A[0] + i*8);
    __m256 _B = _mm256_load_ps(&B[0] + i*8);
    __m256 _C = _mm256_add_ps(_B, _mm256_mul_ps(_a,_A));
    _mm256_store_ps(&C[0] + i*8, _C);
}


int main(){
    std::fill(A.begin(), A.end(), 1.0f);
    std::fill(B.begin(), B.end(), 2.0f);
    bar(0);

    return 0;
}

Run Code Online (Sandbox Code Playgroud)

编译： g++ -mavx t2.cpp -o t2

它在遇到第一条 AVX 指令时退出。我只是希望有人审查我的代码。

这是 gdb 回溯

(gdb) run
Program received signal SIGSEGV, Segmentation fault. …

Run Code Online (Sandbox Code Playgroud)

c++ linux g++ simd avx

Fr3*_*34K

2015 10-28

5
推荐指数

1
解决办法

2378
查看次数

标签统计

avx ×1

c++ ×1

cuda ×1

g++ ×1

gpgpu ×1

gpu ×1

linux ×1

nvidia ×1

simd ×1

共享内存带宽Fermi vs Kepler GPU

Linux 上的 AVX 分段错误

标签 统计

小编Fr3_34K的帖子

标签统计