我在 S3 上托管了 200 GB 的产品图片(这是我的主要文件主机)。
我是否需要将该数据备份到其他地方,或者 S3 是否安全?
我一直在尝试将 S3 存储桶安装到 EC2 实例,然后每晚进行 rsync 备份。问题是它大约有 300 万个文件,因此需要一段时间来生成不同的 rsync 需求。备份实际上需要大约 3 天才能完成。
任何想法如何更好地做到这一点?(如果有必要?)
我一直在研究这个,很有趣。
由于最终的一致性,您到 S3 的备份可能会失败,具体取决于您所在的地区;基本警告是,如果你这样做足够多,在某些时候你会在打开或查找文件时出错,因为亚马逊后台的文件系统魔法在服务器之间同步,所以你的备份可能不可靠。
至于是否需要以其他方式保存它们,这取决于您的风险管理。你相信亚马逊会保存你的数据吗?
他们可能会丢失一些东西,或者他们的存储系统出现更大的故障;毫无疑问,他们的合同中有条款规定,如果他们丢失了您的数据,那就是您的问题。不是他们的。此外,由于您的数据存放在其他地方,您不知道他们会用它做什么;执法部门想要你的数据?您甚至可能不知道其他人访问过它。
你相信吗?如果数据对您的业务不是关键,并且您愿意接受这种风险,则无需将其下载到异地存储。如果您不愿意冒险让您的数据在 Amazon 的存储服务器中是安全的,您应该安排定期将其转储到您自己的存储中。
换句话说,我不认为有一个直接的答案,因为这取决于您的风险承受能力和业务需求。很多人不会完全相信他们的收入仅靠云存储,我个人对此有点警惕......
为了更好地做到这一点,在讨论和研究中,另一种要考虑的方法是创建一个足够大的 EBS 卷来存储数据,将其附加到 EC2 实例,将数据保存在那里,然后您可以卸载该卷并将该数据保存到 S3 . 我正在研究这是否是将卷文件本身保存到 S3 或内容...但是您可以在完成后删除 EBS 实例以节省存储成本。
编辑我在重新阅读时看到您正在从 S3 保存到 EC2 实例,反之亦然(尽管我不知道最终的一致性问题是否仍然会导致问题)。您正在尝试将数据保存到 EC2 实例作为备份?我认为在成本方面这不是一个合理的策略。当您将此类数据的长期存储以及 VM 时间考虑在内时,将内容备份到本地驱动器可能会更便宜。有了驱动器成本,您可以将数据复制到本地磁盘作为备份。
我仍然会保留关于信任亚马逊及其存储的警告。如果您想将所有内容保留在 Amazon S3 中但具有更多冗余,请跨区域复制您的 S3 存储桶,并且如果它们发生影响一个区域的中断,则不应将所有存储桶全部删除。你会希望。不过一切皆有可能。
这归结为您对数据的重视程度、您愿意为此付出多少以及您愿意承受多少风险。
| 归档时间: |
|
| 查看次数: |
10513 次 |
| 最近记录: |