标签: thrust

在我与Thrust失败之后,我专注于cuDPP库,它曾经是CUDA工具包的一部分.cuDPP性能非常好但是库没有最新的cuda 5.5,并且在使用内存检查器进行调试时,cudppMultiScan()函数中存在一些全局内存冲突问题.(cuda 5.5,nsight 3.1,visual studio 2010,gtx 260 cc 1.3)

有没有人知道使用什么而不是这两个库？

cuda thrust cudpp

use*_*472

lucky-day

5
推荐指数

1
解决办法

4288
查看次数

CUDA / CUDA Thrust 中的多态性和派生类

这是我在 Stack Overflow 上的第一个问题，这是一个很长的问题。thrust::device_vector<BaseClass>tl;dr 版本是：如果我希望 a 存储不同类型的对象，我该如何使用 aDerivedClass1，DerivedClass2a ？

\n\n

我想利用 CUDA Thrust 的多态性。我正在编译一个-arch=sm_30GPU (GeForce GTX 670) 进行编译。

\n\n

让我们看一下下面的问题：假设镇上有 80 户家庭。其中60户是已婚夫妇，20户是单亲家庭。因此，每个家庭都有不同数量的成员。现在是人口普查时间，家庭必须说明父母的年龄和孩子的数量。Family因此，政府构建了一个对象数组，thrust::device_vector<Family> familiesInTown(80)即家庭信息familiesInTown[0]对应familiesInTown[59]为已婚夫妇，其余信息（familiesInTown[60]为）familiesInTown[79] ) 为单亲家庭。

\n\n

Family是基类 - 家庭中父母的数量（单亲父母数量为 1，夫妻数量为 2）以及他们拥有的孩子数量作为成员存储在此处。
SingleParent，派生自Family，包括一个新成员 - 单亲父母的年龄，unsigned int ageOfParent。
MarriedCouple，也源自Family，但是，引入了两个新成员 - 父母的年龄，unsigned int ageOfParent1以及unsigned int ageOfParent2。
\n\n …

polymorphism cuda thrust

use*_*303

2017 05-23

5
推荐指数

2
解决办法

3831
查看次数

在线程中使用thrust :: sort

我想知道在一个线程中是否可以使用thrust :: sort()

__global__
void mykernel(float* array, int arrayLength)
{
    int threadID = blockIdx.x * blockDim.x + threadIdx.x;
    // array length is vector in the device global memory
    // is it possible to use inside the thread?
    thrust::sort(array, array+arrayLength);
    // do something else with the array
}

Run Code Online (Sandbox Code Playgroud)

如果是,那么sort会启动其他内核来并行排序吗？

cuda thrust

Bor*_*xis

lucky-day

5
推荐指数

1
解决办法

3094
查看次数

使用Thrust计算带有步幅的迭代器

我正在寻找一种方法来使用该thrust::counting_iterator函数来并行化以下for循环:

for (int stride = 0 ; stride < N * M ; stride+=M) // N iterations
{
    // Body of the loop
}

Run Code Online (Sandbox Code Playgroud)

以下是代码的外观:

struct functor ()
{
   __host__ __device__ void operator() (const int i)
   {
      // Body of the loop
   }
}

thrust::counting_iterator<int> it1(0);
thrust::counting_iterator<int> it2 = it1 + N * M;
thrust::for_each (it1 , it2 , functor());

Run Code Online (Sandbox Code Playgroud)

我知道将counting_iterator迭代器增加1,那么有没有办法增加M？

cuda thrust

作者

2014 07-21

5
推荐指数

1
解决办法

1609
查看次数

如何结合使用thrust和valgrind来检测内存泄漏？

有没有办法将 CUDA Thrust 库与 Valgrind 内存泄漏检查器一起使用？

我问的原因是因为这个简单的程序：

#include <thrust/device_vector.h>

int main(){
    thrust::device_vector<int> D(5);
    assert( D.size() == 5 );
}

Run Code Online (Sandbox Code Playgroud)

编译为：

#include <thrust/device_vector.h>

int main(){
    thrust::device_vector<int> D(5);
    assert( D.size() == 5 );
}

Run Code Online (Sandbox Code Playgroud)

使 Valgrind 相信存在多种可能的内存泄漏。

我知道它们一定是误报，而且 valgrind 不是用来检测 GPU 内存泄漏的，但我想知道是否有一个标志或标准方法可以使这两个工具一起工作（例如检测 CPU 内存泄漏）。

如果有一套标准的 Valgrind 异常，我会很乐意使用它们，但我想在玩 wack-a-mole 之前先问一下。

$ /usr/local/cuda-11.1/bin/nvcc device_vector.cu -o device_vector.cu.x

Run Code Online (Sandbox Code Playgroud)

提到的自述文件README_MISSING_SYSCALL_OR_IOCTL对我来说不是很有帮助。

添加注释：CUDA 附带了一个名为 memchecker 的 memchecker cuda-memcheck，它不会报告上面程序中的内存泄漏，但它似乎不能替代 valgrind，因为它不会检测简单 cpu 程序中的实际内存泄漏：

#include <thrust/device_vector.h>

int main(){
//  thrust::device_vector<int> D(5);
//  assert( D.size() == 5 );
    
// …

Run Code Online (Sandbox Code Playgroud)

c++ valgrind memory-leaks cuda thrust

alf*_*lfC

2021 01-28

5
推荐指数

1
解决办法

620
查看次数

标签统计

cuda ×10

thrust ×10

algorithm ×2

c++ ×2

cudpp ×2

gpu ×2

arrays ×1

gpgpu ×1

hash ×1

memory-leaks ×1

nvidia ×1

polymorphism ×1

valgrind ×1

标签 统计

标签统计