有时我会在网上看到“确保你设置 'bs=' 因为默认值会花费太长时间”的评论,以及我自己非常不科学的经验,“这似乎比其他人花费的时间更长上周时间”似乎证明了这一点。因此,每当我使用“dd”(通常在 1-2GB 范围内)时,我都会确保指定 bytes 参数。大约有一半的时间我使用我从中复制的任何在线指南中指定的值;剩下的时间我会从'fdisk -l'列表中选择一些有意义的数字,我认为是较慢的媒体(例如我正在写入的SD卡)。
对于给定的情况(媒体类型、总线大小或其他重要事项),有没有办法确定“最佳”值?容易确定吗?如果没有,是否有一种简单的方法可以达到 90-95%?或者“只选择大于 512 的东西”甚至是正确答案?
我想过自己尝试这个实验,但是(除了工作量很大)我不确定哪些因素会影响答案,所以我不知道如何设计一个好的实验。
简短版本:在什么情况下可以dd
安全地用于复制数据,安全意味着不存在由于部分读取或写入而导致损坏的风险?
长版本 — 序言: dd
通常用于复制数据,尤其是从设备复制数据或向设备复制数据(示例)。有时将其归因于能够以比其他工具更低的级别访问设备的神秘特性(实际上是设备文件在发挥作用)——但dd if=/dev/sda
与cat /dev/sda
. dd
有时被认为更快,但cat
在实践中可以击败它。尽管如此,它dd
具有独特的特性,使其有时真正有用。
问题: dd if=foo of=bar
实际上与cat <foo >bar
. 在大多数 unices¹ 上,dd
对read()
. (我发现POSIX在什么构成“读取输入块”方面很模糊dd
。)如果read()
返回部分结果(根据 POSIX 和其他参考文档,除非实现文档另有说明,否则允许这样做),则复制部分块。存在完全相同的问题write()
。
观察:在实践中,我发现dd
可以处理块设备和常规文件,但这可能只是我没有太多练习。说到管道,不难找dd
错;例如试试这个代码:
yes | dd of=out bs=1024k count=10
Run Code Online (Sandbox Code Playgroud)
并检查out
文件的大小(它可能远低于 10MB)。
问题:在什么情况下可以dd
安全地用于复制数据?换句话说,在块大小、实现、文件类型等方面的哪些条件可以确保dd
将复制所有数据?
(GNU dd有一个 …
我刚刚通过以下方式备份了整个硬盘驱动器(50GB)ssh
:
dd if=/dev/hda | buffer -s 64k -S 10m | ssh myuser@myhost "cat > ~/image.img"
Run Code Online (Sandbox Code Playgroud)
现在检查文件完整性的最佳方法是什么image.img
,即如何验证是否正确复制了所有内容?