如何获取巨大的 Google Cloud Storage 存储桶中所有对象的报告?

Rah*_*lla 5 bigdata google-cloud-storage google-cloud-platform

我有一个包含多层文件夹的存储桶,其中包含 10000 个文件(并且还在不断增长)。我想知道 GCS 是否有办法导出整个存储桶的 csv 报告?

例如,AWS S3 通过其存储库存提供它。https://docs.aws.amazon.com/AmazonS3/latest/dev/storage-inventory.html

GCS 存储 api 有一个/list端点可以在过渡期间提供帮助,但当单个存储桶中有 10-1 亿个对象时,它似乎不是一个可扩展的选项?

itr*_*lli 5

您可以通过gsutil运行以下命令将结果列表保存到 csv 文件:

gsutil ls -r gs://[BUCKET_NAME] >> list.csv
Run Code Online (Sandbox Code Playgroud)

不过,这只会包含每个对象的完整路径,因此,如果您想要更多信息,vtor 建议的云资产清单是可行的方法。