相关疑难解决方法(0)

CUDA运行时错误(59):触发了设备端断言

我可以访问Tesla K20c,我正在CIFAR10数据集上运行ResNet50 ...然后出现以下错误:
THCudaCheck FAIL file=/opt/conda/conda-bld/pytorch_1524584710464/work/aten/src/THC/generated/../generic/THCTensorMathPointwise.cu line=265 error=59 : device-side assert triggered
Traceback (most recent call last):
File "main.py", line 109, in <module>
train(loader_train, model, criterion, optimizer)
File "main.py", line 54, in train optimizer.step()
File "/usr/local/anaconda35/lib/python3.6/site-packages/torch/optim/sgd.py", line 93, in step
d_p.add_(weight_decay, p.data) RuntimeError: cuda runtime error (59) : device-side assert triggered at /opt/conda/conda-bld/pytorch_1524584710464/work/aten/src/THC/generated/../generic/THCTensorMathPointwise.cu:265
如何解决此错误

gpu pytorch

12
推荐指数
4
解决办法
1万
查看次数

PyTorch 中的“运行时错误:CUDA 错误:设备端断言触发”是什么意思?

我看过很多针对特定案例特定问题的特定帖子,但没有基本的动机解释。这是什么错误:

RuntimeError: CUDA error: device-side assert triggered
Run Code Online (Sandbox Code Playgroud)

意思?具体来说,正在触发的断言是什么,为什么断言在那里,我们如何向后工作以调试问题?

按原样,此错误消息在诊断任何问题时几乎无用,因为它似乎是在说“某处触及 GPU 的某些代码”有问题。Cuda 的文档在这方面似乎也没有帮助,尽管我可能是错的。 https://docs.nvidia.com/cuda/cuda-gdb/index.html

python gpu pytorch

9
推荐指数
2
解决办法
2万
查看次数

标签 统计

gpu ×2

pytorch ×2

python ×1