我MemTest86在客户的机器上运行了很多工作,它非常适合解决内存问题。我的问题是,如何测试 GPU 是否开始运行?
我知道像 3DMark 这样的程序可以将显卡推向极限,但是视频内存呢?值得测试吗?是否有压力工具实际上能够捕获视频卡(内存)中的问题,也许使用 CUDA/OpenCL?
有没有办法找出哪个进程正在使用GPU进行密集计算?(OpenCL、CUDA 等?主要是 OpenCL?)
例如,如果您运行 OpenCL 驱动的视频转码器,您将不会在任务管理器中看到任何内容表明您的 GPU 正在以一种荒谬的速度消耗数据——尽管您的粉丝会开始超速运转。
如果回复是特定于驱动程序的,我主要对 nVidia 感兴趣。
我似乎无法在 Intel Ivy Bridge GPU 的 GPU 端初始化硬件加速 OpenGL(它位于 Core i7-3700K 芯片组上,具有 HD4000 图形核心)。
这是 Windows 8 上的一个新问题。我清楚地记得在 Windows 7 上可以访问 GPU 加速的 OpenCL。事实上,它来自内置的 Intel 处理器图形驱动程序。
我观察到的症状:我运行的每个 OpenCL 程序(无论程序是 32 位还是 64 位)都表明 Intel OpenCL 平台只能在 CPU 上执行。在测量性能时,它绝对慢到可以在 CPU 上运行。从我所见,GPU 端大约快 3-4 倍;我想在 Windows 8 上访问它。
我是否缺少单独的驱动程序下载?我已经尝试过英特尔 OpenCL SDK,包括 2012 和 2013 Beta 版。我仍然只能在 CPU 上使用 OpenCL,这与 GPU 的能力相比非常慢。
我想使用 AMD Ryzen 2400g,但我将在其中安装的三个独立的 AMD Radeon RX580 上使用 OpenCL。如果我安装了 Radeons,APU 上的 Vega 计算单元是否仍然可用?或者他们的安装是否禁用了集成的 vega GPU?
当前运行 Leopard (10.5) 的 Macbook Pro 一次仅使用一张显卡(伪装成电源配置文件更改的决定)。OpenCL(在 10.6 中引入平台)是否会通过仅允许访问活动显卡来延续这一趋势,还是能够使用“空闲”卡上的资源?
最近我编写了同一个程序的几个版本(生成 Julia Sets - 分形图片,大小为 17200x17200 像素)来检查几个不同解决方案的性能。
我写的版本:
测试平台:Intel Core i5 520M、GeForce 330M
我的问题是:如何解释 OpenCL CPU 得分?我预计标准实现的结果接近 4 个线程 - 大约 95 秒,但花费的时间要少得多。当程序运行时,CPU 忙于 390%。怎么会这样?
OpenCL 是否同时使用我的 Core i5 和集成的英特尔核芯显卡?
每当我使用 imagemagick 命令时,我都会看到如下错误和警告:
$ convert -size 99x99 caption:"t" -border 1x1 t.png
convert: clBuildProgram failed. (-11) @ warning/opencl.c/CompileOpenCLKernels/1097.
convert: clCreateCommandQueue failed. (0) @ warning/opencl.c/InitOpenCLEnvInternal/1424
Run Code Online (Sandbox Code Playgroud)
我认为这是因为 Linux 上的开源 ati 驱动程序有问题或不完整。
如何在不重新编译的情况下防止 Imagemagick 使用 OpenCL?我更喜欢只使用我选择的 Linux 发行版提供的版本 - 在这种情况下是 Arch Linux。
我想在没有显卡的 PC 上执行OpenCL代码,也没有任何其他能够执行 OpenCL 的硬件组件。是否有可能以一种可以在 Linux 的 CPU 上执行的方式编译我的 OpenCL 代码?或者是否可以在 CPU 上模拟 GPU 环境?
注意:这是关于测试代码是否按预期工作,而不是关于性能。
当显卡提到它支持原生 OpenCL 是什么意思?
当它没有时会发生什么?而intel 3000又是如何应对的呢?性能和处理细胞数如何?
在互联网上搜索后,我终于成功编译了启用 OpenCL 的 FFMPEG,这使我能够使用 NVIDIA P400(应用了流限制补丁)尝试HDR -> SDR 转换。
\n\n这在很大程度上归功于\xe6\x9e\x97\xe6\xad\xa3\xe6\xb5\xa9的各种详细指南/解释。不幸的是,我对这些命令没有太多的了解,并且我或多或少地复制了各种不同的命令来尝试实现我想要的!
\n\n我的问题是硬件色调映射似乎并不比软件色调映射快。
\n\n以下实现了大约 0.4 倍的速度:
\n\nffmpeg -hwaccel nvdec -init_hw_device opencl=ocl -filter_hw_device ocl -threads 4 -extra_hw_frames 3 -I INPUT.mkv -vf "format=p010,hwupload,tonemap_opencl=t=bt709:r=tv:p=bt709:m=bt709:tonemap=hable:format=p010,hwdownload,format=p010" OUTPUT\nRun Code Online (Sandbox Code Playgroud)\n\n我之前使用软件尝试过的命令达到了类似的 0.6x - 0.4x:
\n\nffmpeg -I INPUT.mkv -vf zscale=t=linear:npl=100,format=gbrpf32le,zscale=p=bt709,tonemap=tonemap=hable:desat=0,zscale=t=bt709:m=bt709:r=tv,format=yuv420p -c:a copy -max_muxing_queue_size 9999 /dev/shm/output.mkv\nRun Code Online (Sandbox Code Playgroud)\n\n我知道它们是相当不同的命令,但就像我说的;从各种示例中剪切和粘贴。
\n\n我的问题是硬件加速色调映射 HDR -> SDR 最有效的命令是什么,并且理想情况下从 4k 降级到 1080p?(我的学习还没有那么深入)
\n\n我希望人们能够看到我已经调查过这个问题,而不仅仅是寻求帮助;我尝试过但未能找到答案!
\n\n先感谢您
\n我正在尝试resize使用 ImageMagick进行 GPU 加速操作。
在我的 Windows 机器上,convert -list configure只使用列表FEATURES OpenMP而不是OpenCL我预期的,因为我安装了 NVidia CUDA GPU。
还有什么我必须做的吗?
在生产中,我们将使用 Linux。我是否还需要做一些额外的事情才能启用硬件加速?
opencl ×11
gpu ×4
linux ×3
cuda ×2
imagemagick ×2
windows ×2
amd-ryzen ×1
cpu ×1
ffmpeg ×1
gpgpu ×1
hdr ×1
ivy-bridge ×1
macbook ×1
memory ×1
monitoring ×1
pci-express ×1
performance ×1
windows-8 ×1