标签: nvidia

Nvidia GPU 上的内存带宽测试

我尝试使用 nvidia 发布的代码并进行内存带宽测试，但得到了一些令人惊讶的结果

使用的程序在这里：https : //developer.nvidia.com/content/how-optimize-data-transfers-cuda-cc

在桌面上（使用 MacOS）

Device: GeForce GT 650M
Transfer size (MB): 16

Pageable transfers
Host to Device bandwidth (GB/s): 4.053219
Device to Host bandwidth (GB/s): 5.707841

Pinned transfers
Host to Device bandwidth (GB/s): 6.346621
Device to Host bandwidth (GB/s): 6.493052

Run Code Online (Sandbox Code Playgroud)

在 Linux 服务器上：

Device: Tesla K20c
Transfer size (MB): 16

Pageable transfers
Host to Device bandwidth (GB/s): 1.482011
Device to Host bandwidth (GB/s): 1.621912

Pinned transfers
Host to Device bandwidth (GB/s): 1.480442
Device to Host …

Run Code Online (Sandbox Code Playgroud)

cuda nvidia

Sag*_*uti

lucky-day

0
推荐指数

1
解决办法

1万
查看次数

如何获取整数值的 NVIDIA 核心温度？

我正在参加 Arduino 微控制器课程，并且正在研究我的期末项目：根据外壳温度工作的自动化计算机冷却系统。

我无法使用以下来源获取 NVIDIA GPU 核心温度：此 MSDN 链接或此 NVIDIA 链接。如何获取 GPU 的温度值？

我的 C# 知识很基础，我对 MSDN 中的手册或代码示例摸不着头脑。

c# gpu arduino nvidia temperature

Men*_*kes

2014 04-08

0
推荐指数

1
解决办法

2006
查看次数

gpugems3 中的前缀扫描 CUDA 示例代码是否正确？

我在 GPU Gems 3, Chapter 39: Parallel Prefix Sum (Scan) with CUDA一书中写了一段代码来调用内核。

然而，我得到的结果是一堆负数而不是前缀扫描。

我的内核调用是错误的还是 GPU Gems 3 书中的代码有问题？

这是我的代码：

#include <stdio.h>
#include <sys/time.h>
#include <cuda.h>

__global__ void kernel(int *g_odata, int  *g_idata, int n, int dim)
{
    extern __shared__ int temp[];// allocated on invocation
    int thid = threadIdx.x;
    int offset = 1;

    temp[2*thid] = g_idata[2*thid]; // load input into shared memory
    temp[2*thid+1] = g_idata[2*thid+1];
    for (int d = n>>1; d > 0; d >>= 1) // build sum in place …

Run Code Online (Sandbox Code Playgroud)

cuda gpu nvidia prefix-sum

dib*_*bid

2019 11-23

0
推荐指数

1
解决办法

1753
查看次数

致命错误：opencv2/core/core.hpp caffe框架安装

我正在尝试使用以下脚本安装 Caffe 框架：https://gist.github.com/jetsonhacks/acf63b993b44e1fb9528并且出现 opencv2/core/core.hpp 错误。

CXX src/caffe/layers/data_layer.cpp
src/caffe/layers/data_layer.cpp:2:33: 
 fatal error: opencv2/core/core.hpp: No such file or directory
#include <opencv2/core/core.hpp>
                             ^
compilation terminated.
make: *** [.build_release/src/caffe/layers/data_layer.o] Error 1

Run Code Online (Sandbox Code Playgroud)

在文档中，OpenCV 是可选的。但那个错误告诉我不是。这include和OpenCV安装无关吗？

linux nvidia caffe pycaffe

Pet*_*čka

2016 05-24

0
推荐指数

1
解决办法

7124
查看次数

查找支持的GPU

我想知道最新的CUDA版本8.0是否支持我的电脑中的GPU,即GeForce GTX 970和Quadro K4200(双GPU系统); 我在网上找不到这些信息.

一般来说,如何找到CUDA版本,特别是新发布的版本,是否支持特定的Nvidia GPU？

谢谢!

cuda gpu nvidia

cha*_*ang

lucky-day

0
推荐指数

1
解决办法

3826
查看次数

Cuda 占用计算器的新版本或替代版本是什么？

我正在使用计算能力为 6.0 的 Tesla P100。我想找到一个工具来自动获取我的内核代码的最佳网格和块大小。

我最近发现了CUDA 占用计算器（.xls 电子表格）。但我意识到它有点过时了（功能直到 2.1 为止）。

我尝试搜索更新的电子表格，包括更高的 CC，但没有任何结果。
所以我寻找替代方案，发现从 CUDA 6.5 开始，引入了Occupancy API 。这是电子表格的更新替代品吗？
此外，我从 GitHub 上找到了这个工具。我可以考虑将此作为替代方案吗？还是使用 Occupancy API 更好？

另外，CUDA 分析器（nvprof或Nsight）可以对占用率进行估计并给出一些最佳的块/网格大小吗？

我对这些工具还很陌生。

cuda nvidia

Mar*_*ara

2022 08-25

0
推荐指数

1
解决办法

964
查看次数

Ubuntu 20.04：HDMI 输出不工作 Nvidia GT 620M

在使用 NVIDIA 显卡 Geforce GF108M [GeForce GT 620M/630M/635M/640M LE] 重新安装 Ubuntu 20.04 时，HDMI 输出不工作，驱动程序似乎也不工作。

ubuntu-drivers devices
== /sys/devices/pci0000:00/0000:00:01.0/0000:01:00.0 ==
modalias : pci:v000010DEd00000DE9sv00001043sd00001477bc03sc00i00
vendor   : NVIDIA Corporation
model    : GF108M [GeForce GT 620M/630M/635M/640M LE]
driver   : nvidia-driver-390 - distro non-free recommended
driver   : nvidia-340 - distro non-free
driver   : xserver-xorg-video-nouveau - distro free builtin

Run Code Online (Sandbox Code Playgroud)

缺少两个依赖项：xserver-xorg-video-nvidia-390 和 ibnvidia-cfg1-390

ubuntu nvidia hdmi ubuntu-20.04

Sté*_*e V

lucky-day

0
推荐指数

1
解决办法

1万
查看次数

使用 Nvidia GPU 加速提取 Ffmpeg 帧会抛出“输出文件 #0 不包含任何流”

我正在尝试将 nvidia gpu 加速解码器 api 与 ffmpeg 结合使用，将视频文件 ( .MTS) 中的所有帧提取到文件夹中，但看起来由于某种原因失败了；我找不到答案或类似问题。

使用的命令：

ffmpeg -vsync 0 -hwaccel cuvid -c:v mpeg2_cuvid -i raw_video.MTS -q:v 2 -f image2 output_folder/image_%05d.jpg

追溯：

ffmpeg version n4.2.2 Copyright (c) 2000-2019 the FFmpeg developers
  built with gcc 9.3.0 (Arch Linux 9.3.0-1)
  configuration: --prefix=/usr --disable-debug --disable-static --disable-stripping --enable-fontconfig --enable-gmp --enable-gnutls --enable-gpl --enable-ladspa --enable-libaom --enable-libass --enable-libbluray --enable-libdav1d --enable-libdrm --enable-libfreetype --enable-libfribidi --enable-libgsm --enable-libiec61883 --enable-libjack --enable-libmfx --enable-libmodplug --enable-libmp3lame --enable-libopencore_amrnb --enable-libopencore_amrwb --enable-libopenjpeg --enable-libopus --enable-libpulse --enable-libsoxr --enable-libspeex --enable-libsrt --enable-libssh --enable-libtheora --enable-libv4l2 --enable-libvidstab --enable-libvorbis …

Run Code Online (Sandbox Code Playgroud)

ffmpeg nvidia codec nvdec

nic*_*eak

2020 05-15

0
推荐指数

1
解决办法

4551
查看次数

如何使用 NVidia GPU 使 tensorflow-gpu v2 在 Windows 上运行

tensorflow-gpu使用 NVidia GPU 在 Windows 上运行 2.x Python 包的步骤是什么？

即我怎样才能摆脱Could not find 'cudart64_101.dll'然后Could not find 'cudnn64_7.dll'？

python windows nvidia tensorflow tensorflow2.0

Dan*_*rod

lucky-day

0
推荐指数

1
解决办法

415
查看次数

使用 C++ 和 CUDA 在 GPU 上读取视频

大家好，感谢您的回答

首先，正如@zkoza和@talonmies指出的那样，Jetson AGX Xavier 与 ARCH 7.2 兼容，而不是 Jetson Nano 案例中使用的 ARCH 5.3。

对于@Yunus Temurlenk =>我的代码中的fname只是myvideo.MOV，因为我在电影的同一剧目中执行我的代码，我还尝试使用从互联网样本中获取的.mp4文件，导致相同的错误。是的，正如您所指出的，在 cmake 命令之后我的 NVCUVID 未打开，正如您在我的原始帖子中看到的，与 CUDA 对应的行是

 NVIDIA CUDA: YES (ver 10.2, CUFFT CUBLAS FAST_MATH)

Run Code Online (Sandbox Code Playgroud)

并不是

 NVIDIA CUDA: YES (ver 10.2, CUFFT NVCUVID CUBLAS FAST_MATH)

Run Code Online (Sandbox Code Playgroud)

我不知道缺少哪些依赖项，但我还在这里看到 NVCUVID 已被弃用： https: //docs.nvidia.com/cuda/video-decoder/index.html

cuda 第 6 步中的示例工作正常:) 我目前正在使用 cuda 10.2 制作 opencv 4.3.0，如果这解决了我的问题，我将更新我的答案。

编辑：不幸的是，在 Ubuntu 18.04 上使用 openCV 4.3.0 和 Cuda 10.2 时，问题完全相同，但我想补充一点，我使用此命令进行编译：

g++ video_reader.cpp -o vr.exe `pkg-config --cflags --libs opencv4`

Run Code Online (Sandbox Code Playgroud)

因为 …

c++ opencv cuda nvidia cmake

作者

2021 01-18

0
推荐指数

1
解决办法

3538
查看次数

标签统计

nvidia ×10

cuda ×5

gpu ×3

arduino ×1

c# ×1

c++ ×1

caffe ×1

cmake ×1

codec ×1

ffmpeg ×1

hdmi ×1

linux ×1

nvdec ×1

opencv ×1

prefix-sum ×1

pycaffe ×1

python ×1

temperature ×1

tensorflow ×1

tensorflow2.0 ×1

ubuntu ×1

ubuntu-20.04 ×1

windows ×1

标签 统计

标签统计