标签: nvidia

Nvidia GPU上的OpenCL ATI Stream SDK

我可以通过安装ATI Stream SDK在Nvidia GPU上编码我的OpenCL应用程序(因为它可以让我加速我的CPU,Nvidia编程SDK也不会)

gpu nvidia ati opencl

shu*_*nya

2012 10-24

2
推荐指数

1
解决办法

1544
查看次数

CUDA Developer Toolkit:显示驱动程序安装失败

我有Nvidia Quadro NVS4200M和Intel Integrated Graphics(在我的笔记本电脑上).我似乎无法使CUDA 5.0工具包安装成功.

我正在运行Windows 7企业版64位.我尝试了64位桌面和笔记本安装程序以及32位安装程序.

所有这些似乎都失败了,并显示错误消息"显示驱动程序安装失败".我从这里安装了最新的驱动程序,它应该支持CUDA-5.0,尽管如此,安装失败了.

失败后,存在库和二进制文件,但未安装NSight Eclipse(似乎没有独立的安装链接).可能的问题是什么？

cuda nvidia

Ani*_*han

lucky-day

2
推荐指数

1
解决办法

6998
查看次数

cudaMemcpy可以接受来自设备的变量作为参数吗？

cudaMemcpy(dst, src, filesize, cudaMemcpyDeviceToHost);

Run Code Online (Sandbox Code Playgroud)

filesize存储在设备全局存储器中的变量在哪里.

cuda gpu nvidia

use*_*453

lucky-day

2
推荐指数

1
解决办法

166
查看次数

是否有可能杀死正在运行的CUDA内核？

让我们说我有很多CUDA内核，我可以要求GPU执行。无论如何，我都不想修改内核代码（包括一个陷阱）。

有没有办法杀死这样一个正在运行的内核？

我打算自动生成内核（遗传编程）。这些内核可能具有需要很长时间才能完成的行为。如果我可以在内核运行时杀死它，那么我可以维护一个计时器并根据需要杀死它。

cuda gpgpu nvidia

Pra*_*ina

lucky-day

2
推荐指数

1
解决办法

963
查看次数

什么是GPU上下文,NVIDIA架构中的GPU硬件通道

在阅读一些与GPU计算相关的论文时,我坚持理解这两个术语GPU上下文,而GPU硬件频道下面简要提到他们,但我无法理解他们的意思,

命令:GPU使用体系结构特定命令进行操作.每个GPU上下文都分配有一个FIFO队列,CPU上运行的程序将提交命令.只有当GPU本身调度相应的命令时,才会触发GPU上的计算和数据传输.

通道:为每个GPU上下文分配一个GPU硬件通道,在其中管理命令调度.Fermi不允许多个通道同时访问同一GPU功能单元,但允许它们共存,在硬件中自动切换.

对此有一个明确而简单的解释.

cuda gpu gpgpu nvidia

HAT*_*ZAB

2014 04-19

2
推荐指数

1
解决办法

3039
查看次数

Matlab GPU计算

我想要一个代码,用于检查计算机上我设计的软件(GUI)是否使用CUDA-Core图形卡(Nvidia)进行处理.得到'真实之后; 从中获取价值,我的软件激活了一些加速过程的功能.

谢谢.

matlab cuda gpu nvidia

use*_*243

lucky-day

2
推荐指数

1
解决办法

2092
查看次数

找不到nvprof应用程序

我正在尝试使用Nvidia nvprof来分析我的CUDA和OpenCL程序.但是,无论我选择哪种基准,唯一的输出是======== Error: application not found.我已经尝试了CUDA和OpenCL基准测试,并重新编译了几次,但似乎无能为力.

我的CUDA版本:4.2

NVIDIA驱动程序版本:334.21

profiler cuda nvidia opencl

ch9*_*h94

lucky-day

2
推荐指数

1
解决办法

2847
查看次数

CUDA GPU是按位置选择的，但是如何将default设置为设备0以外的值？

我最近在家中的机器上安装了第二个GPU（Tesla K40），我的搜索建议第一个PCI插槽成为为CUDA作业选择的默认GPU。一个很棒的链接正在解释它，可以在这里找到：

默认GPU分配

我最初的GPU是TITAN X，也支持CUDA，但它实际上最适合单精度计算，而Tesla则更适合双精度。对于该小组，我的问题是是否有办法将我的默认CUDA编程设备始终设置为第二个？显然，我每次都可以在代码中指定要使用的设备，但是我希望可以对设备进行配置，使其始终默认使用特斯拉卡。

还是打开包装盒并实际交换设备位置的唯一方法？不知怎么对我来说...

任何建议或相关链接可以跟进。

cuda nvidia gpu-programming

tdi*_*ddy

2019 08-29

2
推荐指数

1
解决办法

7126
查看次数

CUDA索引不能按预期工作

我正在尝试使用PyCUDA处理2D数组,我需要每个线程的x,y坐标.

这里和这里已经提出并回答了这个问题,但链接的解决方案对我来说对于超过块大小的2D数据不起作用.为什么？

这是我用来帮助解决这个问题的SourceModule:

mod = SourceModule("""
  __global__ void kIndexTest(float *M, float *X, float*Y)
  {
    int bIdx = blockIdx.x + blockIdx.y * gridDim.x; 
    int idx = bIdx * (blockDim.x * blockDim.y) + (threadIdx.y * blockDim.x) + threadIdx.x;

    /* this array shows me the unique thread indices */
    M[idx] = idx;

    /* these arrays should capture x, y for each unique index */    
    X[idx] = (blockDim.x * blockIdx.x) + threadIdx.x;
    Y[idx] = (blockDim.y * blockIdx.y) + threadIdx.y; …

Run Code Online (Sandbox Code Playgroud)

indexing cuda nvidia pycuda

Dar*_*ane

2017 05-23

2
推荐指数

1
解决办法

751
查看次数