标签: nvidia

Nvidia GPU上的OpenCL ATI Stream SDK

我可以通过安装ATI Stream SDK在Nvidia GPU上编码我的OpenCL应用程序(因为它可以让我加速我的CPU,Nvidia编程SDK也不会)

gpu nvidia ati opencl

2
推荐指数
1
解决办法
1544
查看次数

CUDA Developer Toolkit:显示驱动程序安装失败

我有Nvidia Quadro NVS4200M和Intel Integrated Graphics(在我的笔记本电脑上).我似乎无法使CUDA 5.0工具包安装成功.

我正在运行Windows 7企业版64位.我尝试了64位桌面和笔记本安装程序以及32位安装程序.

所有这些似乎都失败了,并显示错误消息"显示驱动程序安装失败".我从这里安装了最新的驱动程序,它应该支持CUDA-5.0,尽管如此,安装失败了.


失败后,存在库和二进制文件,但未安装NSight Eclipse(似乎没有独立的安装链接).可能的问题是什么?

cuda nvidia

2
推荐指数
1
解决办法
6998
查看次数

cudaMemcpy可以接受来自设备的变量作为参数吗?

cudaMemcpy(dst, src, filesize, cudaMemcpyDeviceToHost);
Run Code Online (Sandbox Code Playgroud)

filesize存储在设备全局存储器中的变量在哪里.

cuda gpu nvidia

2
推荐指数
1
解决办法
166
查看次数

是否有可能杀死正在运行的CUDA内核?

让我们说我有很多CUDA内核,我可以要求GPU执行。无论如何,我都不想修改内核代码(包括一个陷阱)。

有没有办法杀死这样一个正在运行的内核?

我打算自动生成内核(遗传编程)。这些内核可能具有需要很长时间才能完成的行为。如果我可以在内核运行时杀死它,那么我可以维护一个计时器并根据需要杀死它。

cuda gpgpu nvidia

2
推荐指数
1
解决办法
963
查看次数

什么是GPU上下文,NVIDIA架构中的GPU硬件通道

在阅读一些与GPU计算相关的论文时,我坚持理解这两个术语GPU上下文,而GPU硬件频道下面简要提到他们,但我无法理解他们的意思,

命令:GPU使用体系结构特定命令进行操作.每个GPU上下文都分配有一个FIFO队列,CPU上运行的程序将提交命令.只有当GPU本身调度相应的命令时,才会触发GPU上的计算和数据传输.

通道:为每个GPU上下文分配一个GPU硬件通道,在其中管理命令调度.Fermi不允许多个通道同时访问同一GPU功能单元,但允许它们共存,在硬件中自动切换.

对此有一个明确而简单的解释.

cuda gpu gpgpu nvidia

2
推荐指数
1
解决办法
3039
查看次数

Matlab GPU计算

我想要一个代码,用于检查计算机上我设计的软件(GUI)是否使用CUDA-Core图形卡(Nvidia)进行处理.得到'真实之后; 从中获取价值,我的软件激活了一些加速过程的功能.

谢谢.

matlab cuda gpu nvidia

2
推荐指数
1
解决办法
2092
查看次数

找不到nvprof应用程序

我正在尝试使用Nvidia nvprof来分析我的CUDA和OpenCL程序.但是,无论我选择哪种基准,唯一的输出是======== Error: application not found.我已经尝试了CUDA和OpenCL基准测试,并重新编译了几次,但似乎无能为力.

我的CUDA版本:4.2

NVIDIA驱动程序版本:334.21

profiler cuda nvidia opencl

2
推荐指数
1
解决办法
2847
查看次数

CUDA GPU是按位置选择的,但是如何将default设置为设备0以外的值?

我最近在家中的机器上安装了第二个GPU(Tesla K40),我的搜索建议第一个PCI插槽成为为CUDA作业选择的默认GPU。一个很棒的链接正在解释它,可以在这里找到:

默认GPU分配

我最初的GPU是TITAN X,也支持CUDA,但它实际上最适合单精度计算,而Tesla则更适合双精度。对于该小组,我的问题是是否有办法将我的默认CUDA编程设备始终设置为第二个?显然,我每次都可以在代码中指定要使用的设备,但是我希望可以对设备进行配置,使其始终默认使用特斯拉卡。

还是打开包装盒并实际交换设备位置的唯一方法?不知怎么对我来说...

任何建议或相关链接可以跟进。

cuda nvidia gpu-programming

2
推荐指数
1
解决办法
7126
查看次数

CUDA索引不能按预期工作

我正在尝试使用PyCUDA处理2D数组,我需要每个线程的x,y坐标.

这里这里已经提出并回答这个问题,但链接的解决方案对我来说对于超过块大小的2D数据不起作用.为什么?

这是我用来帮助解决这个问题的SourceModule:

mod = SourceModule("""
  __global__ void kIndexTest(float *M, float *X, float*Y)
  {
    int bIdx = blockIdx.x + blockIdx.y * gridDim.x; 
    int idx = bIdx * (blockDim.x * blockDim.y) + (threadIdx.y * blockDim.x) + threadIdx.x;

    /* this array shows me the unique thread indices */
    M[idx] = idx;

    /* these arrays should capture x, y for each unique index */    
    X[idx] = (blockDim.x * blockIdx.x) + threadIdx.x;
    Y[idx] = (blockDim.y * blockIdx.y) + threadIdx.y; …
Run Code Online (Sandbox Code Playgroud)

indexing cuda nvidia pycuda

2
推荐指数
1
解决办法
751
查看次数

如何在ffmpeg中指定nvenc使用的GPU

我使用的ffmpeg的可执行代码转换MPEGTS从h264码流与H265 nvenc和我有两个NVIDIA我的主板上安装图形卡:的GeForce GTX 690和Tesla K-10。ffmpeg中的nvenc是否有任何编解码器特定的参数,可以选择使用我想要的任何这些GPU进行编码?

parameters gpu ffmpeg nvidia nvenc

2
推荐指数
1
解决办法
7378
查看次数

标签 统计

nvidia ×10

cuda ×8

gpu ×5

gpgpu ×2

opencl ×2

ati ×1

ffmpeg ×1

gpu-programming ×1

indexing ×1

matlab ×1

nvenc ×1

parameters ×1

profiler ×1

pycuda ×1