Google云数据流因重复错误“同步Pod错误...通过CrashLoopBackOff未能针对“ sdk”针对“ sdk”失败到“ StartContainer”

Tim*_*Tim 5 go google-cloud-dataflow apache-beam

SDK:适用于Go 0.5.0的Apache Beam SDK

数周以来,我们的Golang作业在Google Cloud Data流上运行良好。我们尚未对作业本身进行任何更新,并且SDK版本似乎与以前相同。昨晚失败了,我不确定为什么。到达1小时的时间限制,由于没有工人活动,该作业被取消。

查看Stackdriver日志,我唯一能看到的就是重复出现的错误 Error syncing pod...failed to "StartContainer" for "sdk" with CrashLoopBackOff

似乎是由于某种原因未能同步pod(?),因此需要等待5分钟才能重试。

任何人都可以阐明造成这种情况的原因以及我们如何找到更多信息或诊断问题的原因吗?

注意:我检查了Google Cloud Data flow的状态,该服务似乎没有任何中断。

and*_*nes 1

我们遇到了类似的情况,发现无法启动工作程序(对我们来说是由于 slf4j 问题,但它可能是任何阻止工作程序以任何语言启动的原因)。

如果您查看 Stackdriver 日志(在 UI 中查看日志,然后单击链接转到 Stackdriver),您应该能够查看日志worker_startup