将 10 TB 的文件从美国传输到英国数据中心

Pau*_*ett 96 file-transfer large-data

我正在将我的服务器从美国迁移到英国,从一个数据中心迁移到另一个数据中心。我的主持人说我应该能够达到每秒 11 兆字节。

操作系统为两端的Windows Server 2008。

我的平均文件大小约为 100 MB,数据分布在五个 2 TB 驱动器上。

传输这些文件的推荐方式是什么?

  • FTP
  • 中小企业
  • Rsync / Robocopy
  • 其他?

我不太担心安全性,因为无论如何这些都是公共文件,但我只是想要一个可以推动完整 11 MB/s 传输速率以最小化总传输时间的解决方案。

Sha*_*den 173

而是将硬盘驱动器运送到大洋彼岸。

在 11 Mbps 的充分利用下,您需要 90 天才能传输 10 TB。


11 Mbps = 1.375 MBps = 116.015 GB/天

10240 GB / 116.015 GB/天 = ~88.3 天

  • 一位智者曾经说过“永远不要低估一辆装满磁带的旅行车在高速公路上疾驰的带宽”。这个等式是非常正确的,并且不会因为改变船的旅行车而发生实质性的改变。(http://www.bpfh.net/sysadmin/never-underestimate-bandwidth.html) (44认同)
  • +1 [Sneakernet](http://en.wikipedia.org/wiki/Sneakernet)。此外,您忘记了 TCP/IP 开销。在理想情况下,它更像是约 100 天。 (43认同)
  • 仍然相信在官方磁盘仍在工作时派人监督 10TB 备份,然后一旦设置完成,您可以午餐 rsync 以更新新服务器以进行任何更改。您将在大约一天内启动并运行机器。 (18认同)
  • 刚刚意识到我输入了 11Mbps,但实际上我的意思是 11MB/s。我想这会有很大的不同,我的计算大约需要 11-14 天……这是正确的吗? (10认同)
  • 最好运送磁带或蓝光磁盘,而不是驱动器。如果您使用驱动器,请确保原件安全且可用以防万一。我会自己购买驱动器(除非我有 Ultrium 4 驱动器),因为 10 TB = 410 个单层蓝光磁盘! (5认同)
  • @PaulHinet 如果您确实想进行电汇传输,我会向您推荐 Korjavin 的回答 - 使用 rsync。哦,如果数据压缩得不错,请添加`-z` 选项以将 gzip 压缩添加到传输中。 (3认同)
  • 不,MP3 文件已经被压缩并且根本不能很好地压缩 - 设置 `-z` 只会浪费 CPU 时间。rsync 应该可以轻松击中整棵树。 (3认同)
  • @Mikey您不想将驱动器联邦快递。清关可能需要 10 天或更长时间。如果您派一个人随身携带满是驱动器,他们 [尽管会受到安全人员的特殊检查,并且可能会有负面表情] 将在大约 14 小时内到达那里。 (3认同)
  • 我会解雇数据中心运营商并获得更好的运营商。 (2认同)
  • @Brennan 你会提出什么建议?这显然不是跨大西洋文件传输的理想通用解决方案,但请记住我的回答的上下文;a) 这是一次性传输,b) 为这种一次性传输设置更宽的互联网电路显然是不可行的,并且 c) 当问题读取为 11Mbps 而不是 11MBps 时提供了它。 (2认同)
  • @Brennan 是的,而且所有这些在时间和财务费用方面都比邮寄费用更高。对于一次性的事情,智力上的懒惰是聪明的。 (2认同)

Luc*_*man 26

我想说 rsync,在 11 MB/s 时,您会看到 10-14 天,即使您被中断,rsync 也很容易从上次停止的地方开始。

在 11 Mbps 时,我会像上面建议的那样运送硬盘:)

  • 差异源于 OP 误报了 11 Mbps,而实际上他的意思是 11 MBps —— 快了 8 倍。顺便说一句,在中断的情况下重新启动 10 TB rsync 可能需要一段时间,不是吗?小时,还是更长? (9认同)
  • rsync 重新启动时间与文件数量有关(根据我的经验,主要来自 `stat` 时间),而不是总数据。我预计不会有明显的等待(最多几分钟)。虽然我在 rsync 方面的经验略低于 5TB。 (6认同)

Kor*_*van 15

当然是Rsync。

至少你可以在休息后随时继续,而且没有任何痛苦。

  • 3 个月以上以 100% 的利用率进行复制。抱歉,这是传输这么多数据的糟糕方式。 (7认同)

Con*_*lls 12

永远不要低估装满磁带的旅行车的带宽

——传统。

在您的情况下,通过快递发送磁盘或磁带,但该原则仍然适用。如果您不担心延迟,这将比在任何合理的时间长度内传输 10TB 数据的网络带宽便宜得多。


小智 10

您应该使用 rsync。它将在发送之前压缩数据并对其进行重复数据删除。它还可以恢复部分传输,这对于任何大型传输都非常重要。

它可能不会传输 10 TB;如果是日志和文本等,它很可能低于 1 TB;也许远低于 1 TB。

有些工具在压缩方面比 rsync 做得更好,并且可能会找到更多匹配项。你可以使用lrzip,等等。

有一些特定类型的数据不能很好地压缩并且不包含文字欺骗 - 例如视频和其他媒体。在这些情况下,FTP 和 rsync 所做的工作大致相同。

  • RSync 对数据进行重复数据删除?我认为它只在文件级别执行此操作,这意味着在这种情况下重复数据删除几乎没有用。 (4认同)

Ask*_*ken 6

我知道这已经被接受,但您是否考虑过将磁盘带到数据中心/提供商/主机,在那里您可以获得更多带宽?这可能会花费您一些钱,但将 10240Gb 复制到备份磁盘并发送也将花费时间和金钱(2 x 金钱)。

您还可以确保您的磁盘在运输过程中不会损坏。

  • @Chris 这个答案建议将磁盘运输到同一大陆上更大的管道。 (2认同)

Coy*_*ote 5

11Mbps?这是你在这里的一个很大的限制。在你的情况下,我会简单地:

  • 克隆数据
  • 压缩它
  • 在两端租用至少 10 倍带宽的服务器(在同一个数据中心或在你附近的数据中心)。
  • 传输文件
  • 将数据应用到新服务器。

如果您真的没有增加带宽的解决方案......那么运送物理驱动器会更快。

从我的痛苦经历来看,硬盘驱动器往往会在邮件中损坏... USB 闪存驱动器是用于频繁数据传输的更好解决方案。在您的情况下,它需要其中的一些 :) 所以在多个硬盘驱动器上发送 2 个数据副本。

考虑到您拥有的数据量,如果另一侧有相同的硬件/软件来插入驱动器,您也可以从 RAID 5 或 RAID 6 阵列发送驱动器。但在这种情况下,请记住标记驱动器的顺序以及它们的序列号,因此在重新配置时它们不会混淆。