标签: nvidia

nVidia SLI技巧

我正在优化directx图形应用程序以利用nVidia的SLI技术.我目前正在调查他们的"最佳实践"网页中提到的一些技术,但想知道你们对此有什么建议/经验?

谢谢!

directx graphics nvidia sli

5
推荐指数
1
解决办法
646
查看次数

NVIDIA Fermi 中的 L2 缓存

在查看NVIDIA Fermi架构中性能计数器的名称(cuda doc文件夹中的文件Compute_profiler.txt)时,我注意到对于L2缓存未命中,有两个性能计数器,l2_subp0_read_sector_misses和l2_subp1_read_sector_misses。他们说这些是用于两片 L2 的。

为什么他们有两片 L2?与流式多处理器架构有什么关系吗?这种划分对性能有什么影响?

谢谢

cuda gpu gpgpu nvidia

5
推荐指数
1
解决办法
836
查看次数

是否可以在窗口模式下在Nvidia 3D Vision硬件上运行Java3D应用程序?

感谢JohnnyO已经回答了是否可以结合nVidia 3D愿景运行Java3D应用程序:

是否可以在Nvidia 3D Vision硬件上运行Java3D应用程序?

他的方法对我来说也很好.但它仅限于全屏模式.

他的线程已经有几个月了,现在在过去的几周里,nVidia改进了3D Vision的驱动程序:现在也可以在窗口模式下运行许多应用程序.如果您使用的是专业硬件,如nVidia Quadro卡或ATI Fire GL,您已经了解并了解窗口模式已有很长时间了.

现在,随着nVidia驱动程序的最新更新(我目前安装了295.73),还可以在窗口模式下运行许多应用程序,如nVidia Picture Viewer,Stereoscopic Player等.

http://nvidia.custhelp.com/app/answers/detail/a_id/2311

通常,DirectX 9应用程序应该在窗口模式下运行,您可以在前面提到的nVidia页面上阅读.我认为Java 3D是一个DirectX 9应用程序.如果我使用:

-Dj3d.debug =真

然后控制台说:

[j3d]使用DirectX D3D 9.0或更高版本.

(当然,似乎没有人正在努力改进Java 3D的DirectX实现.)

有人同时找到了如何在立体窗口模式下运行Java3D的技巧吗?我试过了,但我失败了这么久.我认为这将是一个非常重要的参数 Java 3D的,如果我们解决了这个问题!

java directx java-3d nvidia stereo-3d

5
推荐指数
1
解决办法
725
查看次数

CUDA中有多少个网格

GPU中可以有多少个CUDA网格?

GPU中可以同时存在两个网格吗?或者一个GPU设备只有一个网格?

Kernel1<<gridDim, blockDim>>(dst1, param1);
Kernel1<<gridDim, blockDim>>(dst2, param2);
Run Code Online (Sandbox Code Playgroud)

以上两个内核是同时还是顺序运行的?

parallel-processing cuda gpu nvidia

5
推荐指数
1
解决办法
2592
查看次数

Nvidia GeForce 6xx系列使用什么指令集?

GeForce 6xx系列GPUS是否使用RISC,CISC或VLIW样式指令?

在一个来源中,在http://www.motherboardpoint.com/risc-cisc-t241234.html,有人说
"GPU可能更接近VLIW而不是RISC或CISC".

在另一个来源,http://en.wikipedia.org/wiki/Very_long_instruction_word#implementations,它说"Nvidia和AMD已经转移到RISC架构,以提高非图形工作负载的性能"

gpu nvidia instruction-set

5
推荐指数
1
解决办法
1507
查看次数

"cudaMallocManaged"比"cudaMalloc"慢吗?

我下载了CUDA 6.0 RC并在我的应用程序中使用"cudaMallocManaged"测试了新的统一内存.但是,我发现这个内核速度变慢了.

与cudaMallocManaged(~0.63)相比,使用cudaMalloc后跟cudaMemcpy更快(~0.56).这是预期的吗?

其中一个网站声称cudaMallocManged用于"更快的cuda内核原型",所以我想知道哪个应用程序在性能方面更好?

谢谢.

cuda hpc gpgpu nvidia

5
推荐指数
1
解决办法
9466
查看次数

CUDA中的杂项和线程间通信指令

我一直在玩NVIDIA分析器(nvprof),有两个我不明白的特定指标:

inst_inter_thread_communication
    Number of inter-thread communication instructions executed by non-predicated threads
inst_misc
    Number of miscellaneous instructions executed by non-predicated threads
Run Code Online (Sandbox Code Playgroud)

我只是想知道什么指令是线程间通信指令以及哪些指令属于杂项.

参考:http: //docs.nvidia.com/cuda/profiler-users-guide/#metrics-reference

profiler cuda nvidia instructions

5
推荐指数
1
解决办法
620
查看次数

NVIDIA加速ffmpeg(nvenc_h264)在亚马逊G2实例上死得很慢

与独立的Dell-Precision-T1700(Quadro-k620)相比,使用以下选项编译时的FFMPEG会在Amazon G2实例(g2.2xlarge,GRID K520)上产生极佳的性能

"--enable-nonfree --enable-gpl --enable-version3 --enable-shared --enable pthreads [b]--enable-nvenc[/b] --enable-runtime-cpudetect --disable-doc --enable-libmp3lame"
Run Code Online (Sandbox Code Playgroud)

在ffmpeg二进制文件上花了66秒用以下命令转码5.22分钟BVE_Localize.mp4文件.

时间ffmpeg -y -i BVE_Localize.mp4 -strict -2 -vcodec nvenc_h264 -b 5000k -acodec aac -ab 256k -f mpegts BVELocalize.ts(在G2上花费1m6.990s)

在Dell-Precision-T1700(基于Xeon双核,Quadro K620)的工作站上执行相同的ffmpeg命令时,需要0m41.572秒.

我希望ffmpeg在Amazon G2实例上表现更好.你觉得我怎么会失踪?我的Amazon G2实例配置是Ubuntu 14.04 64位,Cuda 7.0,352.55驱动程序,MSI禁用,NVIDIA SDK 5.0.1

ffmpeg nvidia amazon-ec2

5
推荐指数
0
解决办法
667
查看次数

来自守护程序的错误响应:获取https://nvcr.io/v2/:未授权:需要身份验证

我开始使用NVIDIA GPU CLOUD深度学习平台.我尝试拉入控制台(命令提示符):

docker pull nvcr.io/nvidia/pytorch:17.10
Run Code Online (Sandbox Code Playgroud)

并得到消息:

Error response from daemon: Get https://nvcr.io/v2/: unauthorized: authentication required
Run Code Online (Sandbox Code Playgroud)

我的错是什么?

nvidia nvidia-docker

5
推荐指数
1
解决办法
2643
查看次数

Vulkan是否支持着色器中的原子浮点运算?

对于OpenGL,NV_shader_atomic_float存在Nvidia扩展[1] ,该扩展使原子读取,修改,写入操作能够使用GLSL着色器中的浮点组件来缓冲或纹理存储。

Vulkan是否也存在此功能?我找不到有关任何启用该功能的扩展的信息。Vulkan扩展程序不提供该功能吗?

[1] https://www.khronos.org/registry/OpenGL/extensions/NV/NV_shader_atomic_float.txt

nvidia glsl vulkan

5
推荐指数
2
解决办法
394
查看次数