如何从 AWS Glacier 订购检索驱动器？

Question

我在 AWS Glacier 中有 3.5TB 的数据（文件备份）。我希望 AWS 向我发送带有这些数据的检索驱动器/设备，因为我认为下载不会成功完成。我试图用 Snowball 做到这一点，但不能，因为 Snowball 只让我选择 S3 存储桶。

有没有办法使用 Snowball 选择 Glacier 档案，是否有我应该使用的其他 AWS 磁盘检索服务，或者是否有其他在这种情况下常用的过程，例如可以在几天内可靠地下载 Glacier 档案的客户端？

Answer 1

您无法将数据直接从 Glacier 导出到磁盘。

S3 Glacier 存储类

如果您的数据在 S3 中，移动到 Glacier 存储类，则您发起从 Glacier 到 S3 的检索请求。然后，您可以使用导入/导出或Snowball在驱动器上导出。

一旦它在 S3 中，您就可以使用任何可用的 S3 工具来下载文件。如果您有 100Mbps 的互联网连接并且可以管理 80Mbps，则大约需要 4.5 天，这可能比滚雪球还要快。如果您的 S3 区域远离您所在的位置，您可以潜在地使用S3 传输加速，但它比标准 S3 更昂贵。

直接从 Glacier 检索

我找不到任何简单的方法将数据从 Glacier 获取到磁盘而无需手动下载。Glacier 文档说您发起检索请求，完成后您至少有 24 小时的时间下载它。

我能想到的将数据传送到 Snowball 的唯一方法是

发起 Glacier 请求，等待通知
启动一个 EC2 实例。较大的实例具有更高的网络带宽，增强网络将有所帮助。st1 吞吐量优化驱动器可能比 gp2 SSD 便宜，但如果它只是一两天，那就没什么关系了。您可能仍想从 SSD 启动，但有两个驱动器需要更多工作
将数据从 Glacier 下载到 EC2 文件系统
将数据从 EC2 文件系统上传到 S3
从该 S3 存储桶请求 Snowball。

这可能意味着支付双倍的带宽费用。您也可以使用新的基于文件的 S3 存储网关，但您必须对其进行设置。您也可以使用 EFS，但它很昂贵。最后，可能可以使用s3fs 之类的东西将 S3 映射为硬盘驱动器，但我没有这方面的经验。

如果您从 Glacier 下载由于任何原因失败，您必须重新启动它。对于单个大型 3.5TB 存档，这可能是一个问题。范围检索会有所帮助，但如果它是一个大文件，则必须将其重新拼接在一起。

我认为从 Glacier 下载到 EC2 会比直接下载到您的 PC 更快、更可靠。