通过此链接,我发现 Google Cloud Dataflow 为其工作人员使用 Docker 容器:Google Cloud Dataflow 实例的映像
我看到可以找出 docker 容器的图像名称。
但是,有没有办法获取这个 docker 容器(即我应该从哪个存储库获取它?),修改它,然后指示我的 Dataflow 作业使用这个新的 docker 容器?
我问的原因是我们需要在我们的 docker 上安装各种 C++ 和 Fortran 以及其他库代码,以便 Dataflow 作业可以调用它们,但是这些安装非常耗时,所以我们不想使用“资源”属性df 中的选项。