我尝试使用 nvidia 发布的代码并进行内存带宽测试,但得到了一些令人惊讶的结果
使用的程序在这里:https : //developer.nvidia.com/content/how-optimize-data-transfers-cuda-cc
在桌面上(使用 MacOS)
Device: GeForce GT 650M
Transfer size (MB): 16
Pageable transfers
Host to Device bandwidth (GB/s): 4.053219
Device to Host bandwidth (GB/s): 5.707841
Pinned transfers
Host to Device bandwidth (GB/s): 6.346621
Device to Host bandwidth (GB/s): 6.493052
Run Code Online (Sandbox Code Playgroud)
在 Linux 服务器上:
Device: Tesla K20c
Transfer size (MB): 16
Pageable transfers
Host to Device bandwidth (GB/s): 1.482011
Device to Host bandwidth (GB/s): 1.621912
Pinned transfers
Host to Device bandwidth (GB/s): 1.480442
Device to Host …Run Code Online (Sandbox Code Playgroud) 我正在参加 Arduino 微控制器课程,并且正在研究我的期末项目:根据外壳温度工作的自动化计算机冷却系统。
我无法使用以下来源获取 NVIDIA GPU 核心温度:此 MSDN 链接或此 NVIDIA 链接。如何获取 GPU 的温度值?
我的 C# 知识很基础,我对 MSDN 中的手册或代码示例摸不着头脑。
我在 GPU Gems 3, Chapter 39: Parallel Prefix Sum (Scan) with CUDA一书中写了一段代码来调用内核。
然而,我得到的结果是一堆负数而不是前缀扫描。
我的内核调用是错误的还是 GPU Gems 3 书中的代码有问题?
这是我的代码:
#include <stdio.h>
#include <sys/time.h>
#include <cuda.h>
__global__ void kernel(int *g_odata, int *g_idata, int n, int dim)
{
extern __shared__ int temp[];// allocated on invocation
int thid = threadIdx.x;
int offset = 1;
temp[2*thid] = g_idata[2*thid]; // load input into shared memory
temp[2*thid+1] = g_idata[2*thid+1];
for (int d = n>>1; d > 0; d >>= 1) // build sum in place …Run Code Online (Sandbox Code Playgroud) 我正在尝试使用以下脚本安装 Caffe 框架:https://gist.github.com/jetsonhacks/acf63b993b44e1fb9528并且出现 opencv2/core/core.hpp 错误。
CXX src/caffe/layers/data_layer.cpp
src/caffe/layers/data_layer.cpp:2:33:
fatal error: opencv2/core/core.hpp: No such file or directory
#include <opencv2/core/core.hpp>
^
compilation terminated.
make: *** [.build_release/src/caffe/layers/data_layer.o] Error 1
Run Code Online (Sandbox Code Playgroud)
在文档中,OpenCV 是可选的。但那个错误告诉我不是。这include和OpenCV安装无关吗?
我想知道最新的CUDA版本8.0是否支持我的电脑中的GPU,即GeForce GTX 970和Quadro K4200(双GPU系统); 我在网上找不到这些信息.
一般来说,如何找到CUDA版本,特别是新发布的版本,是否支持特定的Nvidia GPU?
谢谢!
我正在使用计算能力为 6.0 的 Tesla P100。我想找到一个工具来自动获取我的内核代码的最佳网格和块大小。
我最近发现了CUDA 占用计算器(.xls 电子表格)。但我意识到它有点过时了(功能直到 2.1 为止)。
我尝试搜索更新的电子表格,包括更高的 CC,但没有任何结果。
所以我寻找替代方案,发现从 CUDA 6.5 开始,引入了Occupancy API 。这是电子表格的更新替代品吗?
此外,我从 GitHub 上找到了这个工具 。我可以考虑将此作为替代方案吗?还是使用 Occupancy API 更好?
另外,CUDA 分析器(nvprof或Nsight)可以对占用率进行估计并给出一些最佳的块/网格大小吗?
我对这些工具还很陌生。
在使用 NVIDIA 显卡 Geforce GF108M [GeForce GT 620M/630M/635M/640M LE] 重新安装 Ubuntu 20.04 时,HDMI 输出不工作,驱动程序似乎也不工作。
ubuntu-drivers devices
== /sys/devices/pci0000:00/0000:00:01.0/0000:01:00.0 ==
modalias : pci:v000010DEd00000DE9sv00001043sd00001477bc03sc00i00
vendor : NVIDIA Corporation
model : GF108M [GeForce GT 620M/630M/635M/640M LE]
driver : nvidia-driver-390 - distro non-free recommended
driver : nvidia-340 - distro non-free
driver : xserver-xorg-video-nouveau - distro free builtin
Run Code Online (Sandbox Code Playgroud)
缺少两个依赖项:xserver-xorg-video-nvidia-390 和 ibnvidia-cfg1-390
我正在尝试将 nvidia gpu 加速解码器 api 与 ffmpeg 结合使用,将视频文件 ( .MTS) 中的所有帧提取到文件夹中,但看起来由于某种原因失败了;我找不到答案或类似问题。
使用的命令:
ffmpeg -vsync 0 -hwaccel cuvid -c:v mpeg2_cuvid -i raw_video.MTS -q:v 2 -f image2 output_folder/image_%05d.jpg
追溯:
ffmpeg version n4.2.2 Copyright (c) 2000-2019 the FFmpeg developers
built with gcc 9.3.0 (Arch Linux 9.3.0-1)
configuration: --prefix=/usr --disable-debug --disable-static --disable-stripping --enable-fontconfig --enable-gmp --enable-gnutls --enable-gpl --enable-ladspa --enable-libaom --enable-libass --enable-libbluray --enable-libdav1d --enable-libdrm --enable-libfreetype --enable-libfribidi --enable-libgsm --enable-libiec61883 --enable-libjack --enable-libmfx --enable-libmodplug --enable-libmp3lame --enable-libopencore_amrnb --enable-libopencore_amrwb --enable-libopenjpeg --enable-libopus --enable-libpulse --enable-libsoxr --enable-libspeex --enable-libsrt --enable-libssh --enable-libtheora --enable-libv4l2 --enable-libvidstab --enable-libvorbis …Run Code Online (Sandbox Code Playgroud) tensorflow-gpu使用 NVidia GPU 在 Windows 上运行 2.x Python 包的步骤是什么?
即我怎样才能摆脱Could not find 'cudart64_101.dll'然后Could not find 'cudnn64_7.dll'?
大家好,感谢您的回答
首先,正如@zkoza和@talonmies指出的那样,Jetson AGX Xavier 与 ARCH 7.2 兼容,而不是 Jetson Nano 案例中使用的 ARCH 5.3。
对于@Yunus Temurlenk =>我的代码中的fname只是myvideo.MOV,因为我在电影的同一剧目中执行我的代码,我还尝试使用从互联网样本中获取的.mp4文件,导致相同的错误。是的,正如您所指出的,在 cmake 命令之后我的 NVCUVID 未打开,正如您在我的原始帖子中看到的,与 CUDA 对应的行是
NVIDIA CUDA: YES (ver 10.2, CUFFT CUBLAS FAST_MATH)
Run Code Online (Sandbox Code Playgroud)
并不是
NVIDIA CUDA: YES (ver 10.2, CUFFT NVCUVID CUBLAS FAST_MATH)
Run Code Online (Sandbox Code Playgroud)
我不知道缺少哪些依赖项,但我还在这里看到 NVCUVID 已被弃用: https: //docs.nvidia.com/cuda/video-decoder/index.html
cuda 第 6 步中的示例工作正常:) 我目前正在使用 cuda 10.2 制作 opencv 4.3.0,如果这解决了我的问题,我将更新我的答案。
编辑:不幸的是,在 Ubuntu 18.04 上使用 openCV 4.3.0 和 Cuda 10.2 时,问题完全相同,但我想补充一点,我使用此命令进行编译:
g++ video_reader.cpp -o vr.exe `pkg-config --cflags --libs opencv4`
Run Code Online (Sandbox Code Playgroud)
因为 …