分布式Tensorflow:检查失败:大小> = 0

vol*_*fly 5 tensorflow tensorflow-gpu

我正在使用keras 2.0.6。tensorflow的版本是1.3.0。

我的代码可以在theano后端上运行,但是在tensorflow后端上失败:

F tensorflow / core / framework / tensor_shape.cc:241]检查失败:大小> = 0(-14428307456与0)

我想知道是否有人能想到任何可能导致此的原因。

谢谢!

----更新-----

我使用tensorflow在PC上测试了完全相同的代码。它运行完美。

但是,当我在超级计算机上运行它时,它将抛出此错误。

尽管此错误看起来像是溢出,但它不可能没有在我的PC上溢出,而是在超级计算机上溢出。

我怀疑它来自张量流中用于分布式计算的错误。

小智 4

我遇到了同样的错误,但在我缩小批量大小之后,Tensorflow 运行正常。

我认为原因是 GPU 内存不足。