小编che*_*eng的帖子

多GPU Cuda计算

我是多GPU编程的新手,我对multi-gpu计算有一些疑问.例如,我们来看点产品示例.我正在运行一个CPU线程,它创建了2个大型数组A [N]和B [N].由于这些阵列的大小,我需要将他们的点积计算分成2个GPU,两个都是Tesla M2050(计算能力2.0).问题是我需要在由我的CPU线程控制的do-loop中多次计算这些点积.每个点积都需要前一个点的结果.我已经阅读了关于创建2个不同的线程来分别控制2个不同的GPU(如例子中的cuda所述),但我不知道如何在它们之间同步和交换数据.还有另一种选择吗?我非常感谢任何帮助/例子.谢谢!

cuda multi-gpu dot-product

5
推荐指数
1
解决办法
2085
查看次数

设备内存刷新cuda

我正在运行一个 C 程序,在其中调用两次 cuda 主机函数。我想清理这两个调用之间的设备内存。有没有办法可以刷新 GPU 设备内存?我使用的是计算能力为2.0的Tesla M2050

cuda gpu

3
推荐指数
1
解决办法
4577
查看次数

标签 统计

cuda ×2

dot-product ×1

gpu ×1

multi-gpu ×1