标签: nvidia

Nvidia GPU 上的内存带宽测试

我尝试使用 nvidia 发布的代码并进行内存带宽测试,但得到了一些令人惊讶的结果

使用的程序在这里:https : //developer.nvidia.com/content/how-optimize-data-transfers-cuda-cc

在桌面上(使用 MacOS)

Device: GeForce GT 650M
Transfer size (MB): 16

Pageable transfers
Host to Device bandwidth (GB/s): 4.053219
Device to Host bandwidth (GB/s): 5.707841

Pinned transfers
Host to Device bandwidth (GB/s): 6.346621
Device to Host bandwidth (GB/s): 6.493052
Run Code Online (Sandbox Code Playgroud)

在 Linux 服务器上:

Device: Tesla K20c
Transfer size (MB): 16

Pageable transfers
Host to Device bandwidth (GB/s): 1.482011
Device to Host bandwidth (GB/s): 1.621912

Pinned transfers
Host to Device bandwidth (GB/s): 1.480442
Device to Host …
Run Code Online (Sandbox Code Playgroud)

cuda nvidia

0
推荐指数
1
解决办法
1万
查看次数

如何获取整数值的 NVIDIA 核心温度?

我正在参加 Arduino 微控制器课程,并且正在研究我的期末项目:根据外壳温度工作的自动化计算机冷却系统。

我无法使用以下来源获取 NVIDIA GPU 核心温度:此 MSDN 链接此 NVIDIA 链接。如何获取 GPU 的温度值?

我的 C# 知识很基础,我对 MSDN 中的手册或代码示例摸不着头脑。

c# gpu arduino nvidia temperature

0
推荐指数
1
解决办法
2006
查看次数

gpugems3 中的前缀扫描 CUDA 示例代码是否正确?

我在 GPU Gems 3, Chapter 39: Parallel Prefix Sum (Scan) with CUDA一书中写了一段代码来调用内核。

然而,我得到的结果是一堆负数而不是前缀扫描。

我的内核调用是错误的还是 GPU Gems 3 书中的代码有问题?

这是我的代码:

#include <stdio.h>
#include <sys/time.h>
#include <cuda.h>

__global__ void kernel(int *g_odata, int  *g_idata, int n, int dim)
{
    extern __shared__ int temp[];// allocated on invocation
    int thid = threadIdx.x;
    int offset = 1;

    temp[2*thid] = g_idata[2*thid]; // load input into shared memory
    temp[2*thid+1] = g_idata[2*thid+1];
    for (int d = n>>1; d > 0; d >>= 1) // build sum in place …
Run Code Online (Sandbox Code Playgroud)

cuda gpu nvidia prefix-sum

0
推荐指数
1
解决办法
1753
查看次数

致命错误:opencv2/core/core.hpp caffe框架安装

我正在尝试使用以下脚本安装 Caffe 框架:https://gist.github.com/jetsonhacks/acf63b993b44e1fb9528并且出现 opencv2/core/core.hpp 错误。

CXX src/caffe/layers/data_layer.cpp
src/caffe/layers/data_layer.cpp:2:33: 
 fatal error: opencv2/core/core.hpp: No such file or directory
#include <opencv2/core/core.hpp>
                             ^
compilation terminated.
make: *** [.build_release/src/caffe/layers/data_layer.o] Error 1
Run Code Online (Sandbox Code Playgroud)

在文档中,OpenCV 是可选的。但那个错误告诉我不是。这include和OpenCV安装无关吗?

linux nvidia caffe pycaffe

0
推荐指数
1
解决办法
7124
查看次数

查找支持的GPU

我想知道最新的CUDA版本8.0是否支持我的电脑中的GPU,即GeForce GTX 970和Quadro K4200(双GPU系统); 我在网上找不到这些信息.

一般来说,如何找到CUDA版本,特别是新发布的版本,是否支持特定的Nvidia GPU?

谢谢!

cuda gpu nvidia

0
推荐指数
1
解决办法
3826
查看次数

Cuda 占用计算器的新版本或替代版本是什么?

我正在使用计算能力为 6.0 的 Tesla P100。我想找到一个工具来自动获取我的内核代码的最佳网格和块大小。

我最近发现了CUDA 占用计算器(.xls 电子表格)。但我意识到它有点过时了(功能直到 2.1 为止)。

  • 我尝试搜索更新的电子表格,包括更高的 CC,但没有任何结果。

  • 所以我寻找替代方案,发现从 CUDA 6.5 开始,引入了Occupancy API 。这是电子表格的更新替代品吗?

  • 此外,我从 GitHub 上找到了这个工具 。我可以考虑将此作为替代方案吗?还是使用 Occupancy API 更好?

另外,CUDA 分析器(nvprofNsight)可以对占用率进行估计并给出一些最佳的块/网格大小吗?

我对这些工具还很陌生。

cuda nvidia

0
推荐指数
1
解决办法
964
查看次数

Ubuntu 20.04:HDMI 输出不工作 Nvidia GT 620M

在使用 NVIDIA 显卡 Geforce GF108M [GeForce GT 620M/630M/635M/640M LE] 重新安装 Ubuntu 20.04 时,HDMI 输出不工作,驱动程序似乎也不工作。

ubuntu-drivers devices
== /sys/devices/pci0000:00/0000:00:01.0/0000:01:00.0 ==
modalias : pci:v000010DEd00000DE9sv00001043sd00001477bc03sc00i00
vendor   : NVIDIA Corporation
model    : GF108M [GeForce GT 620M/630M/635M/640M LE]
driver   : nvidia-driver-390 - distro non-free recommended
driver   : nvidia-340 - distro non-free
driver   : xserver-xorg-video-nouveau - distro free builtin
Run Code Online (Sandbox Code Playgroud)

缺少两个依赖项:xser​​ver-xorg-video-nvidia-390 和 ibnvidia-cfg1-390

ubuntu nvidia hdmi ubuntu-20.04

0
推荐指数
1
解决办法
1万
查看次数

使用 Nvidia GPU 加速提取 Ffmpeg 帧会抛出“输出文件 #0 不包含任何流”

我正在尝试将 nvidia gpu 加速解码器 api 与 ffmpeg 结合使用,将视频文件 ( .MTS) 中的所有帧提取到文件夹中,但看起来由于某种原因失败了;我找不到答案或类似问题。

使用的命令:

ffmpeg -vsync 0 -hwaccel cuvid -c:v mpeg2_cuvid -i raw_video.MTS -q:v 2 -f image2 output_folder/image_%05d.jpg

追溯:

ffmpeg version n4.2.2 Copyright (c) 2000-2019 the FFmpeg developers
  built with gcc 9.3.0 (Arch Linux 9.3.0-1)
  configuration: --prefix=/usr --disable-debug --disable-static --disable-stripping --enable-fontconfig --enable-gmp --enable-gnutls --enable-gpl --enable-ladspa --enable-libaom --enable-libass --enable-libbluray --enable-libdav1d --enable-libdrm --enable-libfreetype --enable-libfribidi --enable-libgsm --enable-libiec61883 --enable-libjack --enable-libmfx --enable-libmodplug --enable-libmp3lame --enable-libopencore_amrnb --enable-libopencore_amrwb --enable-libopenjpeg --enable-libopus --enable-libpulse --enable-libsoxr --enable-libspeex --enable-libsrt --enable-libssh --enable-libtheora --enable-libv4l2 --enable-libvidstab --enable-libvorbis …
Run Code Online (Sandbox Code Playgroud)

ffmpeg nvidia codec nvdec

0
推荐指数
1
解决办法
4551
查看次数

如何使用 NVidia GPU 使 tensorflow-gpu v2 在 Windows 上运行

tensorflow-gpu使用 NVidia GPU 在 Windows 上运行 2.x Python 包的步骤是什么?

即我怎样才能摆脱Could not find 'cudart64_101.dll'然后Could not find 'cudnn64_7.dll'

python windows nvidia tensorflow tensorflow2.0

0
推荐指数
1
解决办法
415
查看次数

使用 C++ 和 CUDA 在 GPU 上读取视频

大家好,感谢您的回答

首先,正如@zkoza@talonmies指出的那样,Jetson AGX Xavier 与 ARCH 7.2 兼容,而不是 Jetson Nano 案例中使用的 ARCH 5.3。

对于@Yunus Temurlenk =>我的代码中的fname只是myvideo.MOV,因为我在电影的同一剧目中执行我的代码,我还尝试使用从互联网样本中获取的.mp4文件,导致相同的错误。是的,正如您所指出的,在 cmake 命令之后我的 NVCUVID 未打开,正如您在我的原始帖子中看到的,与 CUDA 对应的行是

 NVIDIA CUDA: YES (ver 10.2, CUFFT CUBLAS FAST_MATH)
Run Code Online (Sandbox Code Playgroud)

并不是

 NVIDIA CUDA: YES (ver 10.2, CUFFT NVCUVID CUBLAS FAST_MATH)
Run Code Online (Sandbox Code Playgroud)

我不知道缺少哪些依赖项,但我还在这里看到 NVCUVID 已被弃用: https: //docs.nvidia.com/cuda/video-decoder/index.html

cuda 第 6 步中的示例工作正常:) 我目前正在使用 cuda 10.2 制作 opencv 4.3.0,如果这解决了我的问题,我将更新我的答案。

编辑:不幸的是,在 Ubuntu 18.04 上使用 openCV 4.3.0 和 Cuda 10.2 时,问题完全相同,但我想补充一点,我使用此命令进行编译:

g++ video_reader.cpp -o vr.exe `pkg-config --cflags --libs opencv4`
Run Code Online (Sandbox Code Playgroud)

因为 …

c++ opencv cuda nvidia cmake

0
推荐指数
1
解决办法
3538
查看次数