Keras与GPU上的Tensorflow后端.MKL错误:进入DLASCL时参数4不正确

O O*_*web 5 numpy intel-mkl anaconda keras tensorflow

我使用以下命令将带有GPU支持的Tensorflow和Keras安装到Anaconda(v1.6.5)中的环境中:

conda install -n EnvName tensorflow-gpu
conda install -n EnvName -c conda-forge keras-gpu
Run Code Online (Sandbox Code Playgroud)

我的机器上安装了NVIDIA Quadro 2200K,驱动程序为v384.66,cuda-8.0,cudnn 7.0

当我在训练阶段尝试使用Keras运行python代码时,我得到以下内容

英特尔MKL错误:进入DLASCL时参数4不正确.

然后

文件"/home/User/anaconda3/envs/keras_gpu/lib/python3.6/site-packages/numpy/linalg/linalg.py",第99行,在_raise_linalgerror_svd_nonconvergence中引发LinAlgError("SVD没有收敛")numpy.linalg .linalg.LinAlgError:SVD没有收敛

其他相关消息来源建议检查NaN和Infs的数据,但我的数据肯定是干净的.顺便说一句,CPU版本的安装工作正常,只有在尝试在GPU上运行时才会出现问题

我试图重新安装Anaconda,重新安装CUDA和numpy,但它没有成功.

O O*_*web 5

问题出在包mkl(2018.0.0)中 - 好像它最近已经发布并且与Tensorflow(1.3.0)和Keras(2.0.5)通过conda*提供的一些软件包的版本冲突.

所以我手动降级MKL使用蟒蛇导航到v11.3.3自动导致降级其他包的,现在一切运作良好.

在此输入图像描述

  • conda install mkl == 11.3.3 (4认同)