简短版本:在什么情况下可以dd
安全地用于复制数据,安全意味着不存在由于部分读取或写入而导致损坏的风险?
长版本 — 序言: dd
通常用于复制数据,尤其是从设备复制数据或向设备复制数据(示例)。有时将其归因于能够以比其他工具更低的级别访问设备的神秘特性(实际上是设备文件在发挥作用)——但dd if=/dev/sda
与cat /dev/sda
. dd
有时被认为更快,但cat
在实践中可以击败它。尽管如此,它dd
具有独特的特性,使其有时真正有用。
问题: dd if=foo of=bar
实际上与cat <foo >bar
. 在大多数 unices¹ 上,dd
对read()
. (我发现POSIX在什么构成“读取输入块”方面很模糊dd
。)如果read()
返回部分结果(根据 POSIX 和其他参考文档,除非实现文档另有说明,否则允许这样做),则复制部分块。存在完全相同的问题write()
。
观察:在实践中,我发现dd
可以处理块设备和常规文件,但这可能只是我没有太多练习。说到管道,不难找dd
错;例如试试这个代码:
yes | dd of=out bs=1024k count=10
Run Code Online (Sandbox Code Playgroud)
并检查out
文件的大小(它可能远低于 10MB)。
问题:在什么情况下可以dd
安全地用于复制数据?换句话说,在块大小、实现、文件类型等方面的哪些条件可以确保dd
将复制所有数据?
(GNU dd有一个 …
我有一个 1 TB 的文件。我想从字节 12345678901 读取到字节 19876543212 并将其放在具有 100 MB RAM 的机器上的标准输出上。
我可以轻松编写一个执行此操作的 perl 脚本。sysread 提供 700 MB/s(很好),但 syswrite 仅提供 30 MB/s。我想要更高效的东西,最好是每个 Unix 系统都安装的东西,并且可以以 1 GB/s 的速度交付。
我的第一个想法是:
dd if=1tb skip=12345678901 bs=1 count=$((19876543212-12345678901))
Run Code Online (Sandbox Code Playgroud)
但这效率不高。
编辑:
我不知道我是如何测量 syswrite 错误的。这提供了 3.5 GB/s:
perl -e 'sysseek(STDIN,shift,0) || die; $left = shift; \
while($read = sysread(STDIN,$buf, ($left > 32768 ? 32768 : $left))){ \
$left -= $read; syswrite(STDOUT,$buf);
}' 12345678901 $((19876543212-12345678901)) < bigfile
Run Code Online (Sandbox Code Playgroud)
并避免yes | dd bs=1024k count=10 | wc
噩梦。