为什么从 tmpfs 中删除大文件不是即时的?

Vi.*_*Vi. 1 linux filesystems virtual-memory tmpfs

$ cat /proc/mounts | egrep ' /tmp '
tmpfs /tmp tmpfs rw,nosuid,nodev,relatime 0 0
$ dd if=/dev/zero bs=1M count=3000 of=/tmp/q
3000+0 records in
3000+0 records out
3145728000 bytes (3.1 GB) copied, 1.04961 s, 3.0 GB/s
$ time rm /tmp/q

real    0m0.296s
user    0m0.000s
sys     0m0.290s
Run Code Online (Sandbox Code Playgroud)

为什么不0.000s呢?不涉及磁盘,只是标记不再使用内存。

thr*_*rig 5

“将该内存标记为未使用”是unlinkat(2)系统调用必须完成多少工作的函数,而这又与文件的大小呈线性关系。对于tmpfs具有约 4G 内存的 RHEL 6 系统上的默认设置,这可以如下所示进行演示。

$ sudo mkdir /tmpfs; sudo mount -t tmpfs -o size=75% tmpfs /tmpfs; cd /tmpfs
$ dd if=/dev/zero bs=1M of=blah count=2859
...
$ strace -c rm blah 2>&1 | head -3
% time     seconds  usecs/call     calls    errors syscall
------ ----------- ----------- --------- --------- ----------------
100.00    0.241964      241964         1           unlinkat
$ for c in 500 1000 1500 2000 2500; do dd if=/dev/zero bs=1M of=blah count=$c 2>/dev/null; echo -n "$c "; strace -c rm blah 2>&1 | awk '/unlinkat/{print $3}'; done
500 53992
1000 88986
1500 135980
2000 174974
2500 222966
Run Code Online (Sandbox Code Playgroud)

至于unlinkat(2)系统调用在做什么,这需要深入挖掘源代码;我的猜测是,当文件被删除时,代表内存中文件的数据结构(一个链表?)正在循环,从而解释了操作时间随文件大小的线性增长。