d-_*_*_-b 3 google-app-engine google-cloud-storage
根据Google云端存储的文档,使用时存在一些限制gsutil compose(见下文).
是否有更有效的方法将大量文件组合在同一个存储桶中(约1百万)?
如果我理解正确,我将不得不加入32人小组,然后继续这样做并再次加入?
请注意,在单个操作中可以组成的组件数量存在限制(当前为32).
给定复合对象的组件总数存在限制(当前为1024).这意味着您最多可以追加1023次每个对象.
每个项目的速率限制(目前为200)与每秒可以组成的组件数量有关.此速率计算附加到复合对象的组件以及复制它们所属的复合对象时要复制的组件.
GCS 不再强制执行组件计数限制。只要新创建的对象 <= 5 TiB,您就可以合并 100 万个文件。您仍然必须通过递归组合以 32 个为一组加入文件,如此处所述。
串行执行此操作的一种简单方法是通过重复覆盖将其附加到单个对象。例如:
由于每个项目的组合速率限制也已取消,您也可以通过批量组合临时对象,然后删除临时对象来并行执行此操作。
唯一的警告是componentCount元数据属性在 2,147,483,647 处饱和,即使对象具有 > 2,147,483,647 个组件。如果您不依赖于componentCount准确,那么这应该不是问题,因为componentCount不会影响 compose 是否成功。
不幸的是,由于"总计"组件限制为1024,因此无法一次又一次地组合32个组.
相反,你需要做的是:
大部分工作可以并行完成,这将大大加快速度.
| 归档时间: |
|
| 查看次数: |
1457 次 |
| 最近记录: |