使用CUDA支持构建OpenCV

Ana*_*oly 20 opencv cuda

我使用CMake生成visual studio 2013解决方案.接下来我尝试构建它,但得到以下错误:

构建NVCC(设备)对象模块/ core/CMakeFiles/cuda_compile.dir/src/cuda/Debug/cuda_compile_generated_gpu_mat.cu.obj

nvcc致命:不支持的gpu架构'compute_11'

我尝试使用cuda 6.5和7.0版本2.10和3.0.CUDA_ARCH_BIN设置为:1.1 1.2 1.3 2.0 2.1(2.0)3.0 3.5

use*_*942 21

另外一个选项.Ubuntu 14.04,GTX Titan X,opencv-2.4.10

cmake -D CMAKE_BUILD_TYPE=Release -D CMAKE_INSTALL_PREFIX=/usr/local -D BUILD_TIFF=ON -D BUILD_EXAMPLES=ON -D CUDA_GENERATION=Auto -D BUILD_NEW_PYTHON_SUPPORT=ON  .. 
Run Code Online (Sandbox Code Playgroud)

我也应用了补丁,但我不确定它是否最终需要.我曾经尝试过,CUDA_GENERATION=Maxwell但没有检测到Maxwell.我没有CUDA_GENERATION=Auto在补丁之前尝试,这就是为什么我不确定.


小智 13

使用cmake进行配置时,请将选项CUDA_GENERATION设置为特定的GPU体系结构.我遇到了同样的错误并试图解决这个问题.


Ulr*_*ern 10

跟进Yun的回答(无法发表评论),这对我有用,并显示了CUDA_GENERATION的可能值:

cmake -D CMAKE_BUILD_TYPE=RELEASE -D CMAKE_INSTALL_PREFIX=/usr/local -D CUDA_GENERATION=Kepler ..
Run Code Online (Sandbox Code Playgroud)

(Ubuntu 12.04和14.04,GTX Titan和OpenCV 2.4.11和3.0.0.)


rob*_*b3c 6

您可以使用CUDA_GENERATION它为GPU体系结构指定相应的生成代码名称.

这是解析值的相关opencv cmake代码CUDA_GENERATION:

  set(__cuda_arch_ptx "")
  if(CUDA_GENERATION STREQUAL "Fermi")
    set(__cuda_arch_bin "2.0")
  elseif(CUDA_GENERATION STREQUAL "Kepler")
    set(__cuda_arch_bin "3.0 3.5 3.7")
  elseif(CUDA_GENERATION STREQUAL "Maxwell")
    set(__cuda_arch_bin "5.0 5.2")
  elseif(CUDA_GENERATION STREQUAL "Pascal")
    set(__cuda_arch_bin "6.0 6.1")
  elseif(CUDA_GENERATION STREQUAL "Volta")
    set(__cuda_arch_bin "7.0")
  elseif(CUDA_GENERATION STREQUAL "Auto")
    execute_process( COMMAND "${CUDA_NVCC_EXECUTABLE}" ${CUDA_NVCC_FLAGS} "${OpenCV_SOURCE_DIR}/cmake/checks/OpenCVDetectCudaArch.cu" "--run"
                     WORKING_DIRECTORY "${CMAKE_BINARY_DIR}${CMAKE_FILES_DIRECTORY}/CMakeTmp/"
                     RESULT_VARIABLE _nvcc_res OUTPUT_VARIABLE _nvcc_out
                     ERROR_QUIET OUTPUT_STRIP_TRAILING_WHITESPACE)
    if(NOT _nvcc_res EQUAL 0)
      message(STATUS "Automatic detection of CUDA generation failed. Going to build for all known architectures.")
    else()
      set(__cuda_arch_bin "${_nvcc_out}")
      string(REPLACE "2.1" "2.1(2.0)" __cuda_arch_bin "${__cuda_arch_bin}")
    endif()
endif()
Run Code Online (Sandbox Code Playgroud)

维基百科的CUDA页面有一个很好的表格,用于将您的视频卡映射到正确的微体系结构代码名称(抱歉,它太大而无法在此重现):

https://en.wikipedia.org/wiki/CUDA#GPUs_supported

例如,我的middling-2012 Macbook Pro有一个古老的GeForce GT 650M,维基百科表显示使用Kepler微架构.因此,我在我的cmake命令行中使用它:

cmake -D CUDA_GENERATION="Kepler" ...

并且opencv脚本在显示配置摘要时将其转换为"3.0 3.5 3.7",并将相应的标志传递给nvcc.

在我的情况下,在正确设置之前,我收到了compute_70不支持的错误.显然,截至今天(2017-10-07),opencv跟踪器仍有一个关于自动检测无法正常工作的问题.