gcsfuse 是否将所有数据同步到它所安装的系统?

use*_*187 3 docker google-cloud-storage google-cloud-platform gcsfuse

场景:

  • 我已将 gcsfuse 驱动器安装到我的 docker 容器,以便我可以从 Google Cloud Storage 存储和读取数据
  • docker 容器只有少量存储空间,但我可能在 Google Cloud Sorage 中有 TB 级的数据

问题:

gcsfuse 是从 Google Cloud Storage 下载所有数据,还是仅在我尝试读取文件时检索文件?相反,一旦我将数据写入已安装的驱动器,该数据是保留在本地存储,还是发送到 GCS 并从本地存储中删除

总体关注,以防我问错了问题

我担心 gcsfuse 安装的驱动器可能会导致所有容器存储被用完,即使数据实际上存储在 Google Cloud 上。我正在尝试评估这是否是一个合理的问题,或者 gcsfuse 是否是为处理此类情况而构建的。

对于那些要告诉我“只需阅读文档”的人

是的,我试过了。如果这些信息在文件中,那么它被埋得足够深或足够模糊,这可能值得在这里提出作为一个问题。

小智 5

gcsfuse 不会下载存储桶中的所有数据。它存储已写入但未在本地关闭的所有文件的全部内容。对于非脏文件,读取直接从 GCS 提供,不会产生本地存储。