mes*_*llo 3 ubuntu large-files ssd cp rsync
我目前正在使用rsync
将 73GB 文件从三星便携式 SSD T7 复制到 HPC 集群。
rsync -avh path/to/dataset me@server.somewhere:/path/to/dest
Run Code Online (Sandbox Code Playgroud)
以下适用:
问题是,9个小时后,移动仍然没有完成。根据1,使用cp
空目录更好(第一次)。我不明白这一点,也不明白这是否属实。有人可以解释一下吗?
你这么说,
\nrsync
运行速度约为 1-5 MB/s。鉴于 1 MB/s 大约为 10 Mb/s 我会说rsync
对您来说是一个很大的帮助。
我,我可能会添加压缩-z
,并且由于您rsync
在网络连接上使用合理的标志,因此可能会中断它并重新启动压缩。它只会从上次停下的地方继续。
快速计算一下:73 GB 就是 73,000 MB *,也就是 730,000 Mb \xe2\x80\xa1。大约。您的网络速度为 8 Mb/s,这意味着复制大约需要 730,000/8 = 91,250 秒。25 小时,假设理论最大使用网络带宽。
\n* 为什么是 1000:1 而不是 1024:1?部分是因为 GB:MB 严格为 1000:1,但主要是因为这是近似计算
\n \xe2\x80\xa1 为什么 10:1 而不是 8 位到 1 字节建议的 8:1?有两个原因:(a) 这是一个 O(n) 近似值,(b) 需要考虑数据包/协议开销。
现在尝试严格按照要求回答问题,即“第一次运行时 cp 比 rsync 更快吗? ”。如果您正在使用,cp
则需要有一些东西来管理本地和远程服务器之间的传输;这可能是类似sshfs
NFS 的东西,或者您可能指的是scp
.
cp
通过 NFS 安装的文件系统。通过良好调整的网络,这可能相当有效。cp
超过sshfs
。这不仅包括加密开销,ssh
还包括文件系统 FUSE 实现的内核和用户空间之间的转换。效率低下。scp
(隐式结束ssh
)。这将包括来自 的加密开销ssh
。可以接受,并且可能进一步受益于链接压缩 ( -C
)。rsync
(隐含地结束了,ssh
因为我们没有提到rsyncd
)。这将包括来自 的加密开销ssh
。可以接受,并且可能进一步受益于协议压缩(-z
)。我没有采取定量的绩效指标;这些是定性评估。但是,请注意类似答案的评论为什么 scp 这么慢以及如何使其更快?,尽管公平地说,这是讨论多个文件而不是一个大文件的比较传输速率。
\n然而,rsync
通过网络连接的优势在于它可以重新启动。--partial
即使在传输过程中也有正确的标志(即)。对于一个 73GB 的文件来说,传输时间大约需要 25 小时,这是一个巨大的潜在优势。
归档时间: |
|
查看次数: |
4850 次 |
最近记录: |