Pytorch 模型：不同机器上的推理结果截然不同？

ccl*_*ccl 6 python python-3.x pytorch

我在 Pytorch 中训练了一个分割模型，并0.93在我的本地计算机（Windows、conda、CUDA 10.2、Pytorch 1.2）上测试了它的 F1 分数。但是，在0.3Linux 服务器（conda、CUDA 9.0、Pytorch 1.1）上测试时，F1 分数下降到了。我仔细检查了两组代码、标签文件、测试集是否相同，并且我的代码中没有“显式”随机抽样（即使是这样，效果也不应该如此剧烈）。

我尝试了以下方法来解决我的问题：

我怀疑它可能与 Pytorch 版本有关，所以在我的 Windows 机器上安装了 Pytorch 1.1 以匹配服务器的，但得到了相同的0.93分数。然后我认为这与 CUDA 本身有关，因此完全消除了 GPU 因素并在服务器上对 cpu 进行了推理，我仍然0.3在服务器上。

什么可能导致这种巨大的差异？

归档时间：	5 年，12 月前
查看次数：	938 次
最近记录：	5 年，2 月前