Pytorch 模型:不同机器上的推理结果截然不同?

ccl*_*ccl 6 python python-3.x pytorch

我在 Pytorch 中训练了一个分割模型,并0.93在我的本地计算机(Windows、conda、CUDA 10.2、Pytorch 1.2)上测试了它的 F1 分数。但是,在0.3Linux 服务器(conda、CUDA 9.0、Pytorch 1.1)上测试时,F1 分数下降到了。我仔细检查了两组代码、标签文件、测试集是否相同,并且我的代码中没有“显式”随机抽样(即使是这样,效果也不应该如此剧烈)。

我尝试了以下方法来解决我的问题:

我怀疑它可能与 Pytorch 版本有关,所以在我的 Windows 机器上安装了 Pytorch 1.1 以匹配服务器的,但得到了相同的0.93分数。然后我认为这与 CUDA 本身有关,因此完全消除了 GPU 因素并在服务器上对 cpu 进行了推理,我仍然0.3在服务器上。

什么可能导致这种巨大的差异?