Siy*_*Ren 7 unix filesystems io posix sparse-file
给定文件描述符或文件名,如何知道是否可以写入任意位置而无需等待介入部分在磁盘上显式清零?
您可以stat()通过该文件获取文件大小和磁盘块数量,在文件末尾查找相对较少数量的磁盘块,写入已知数量的块,然后再次统计文件。将磁盘块的原始数量与最终数量进行比较。如果文件系统不支持稀疏文件,那么写入几个磁盘块不会花费太长时间。
给定原始和最终的磁盘块数,然后尝试确定文件系统是否支持稀疏文件。我说“尝试”是因为某些文件系统可能会使这变得困难 - 例如,启用压缩的 ZFS。
像这样的东西:
#include <unistd.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <stdio.h>
#include <string.h>
#include <errno.h>
int check( const char *filename )
{
struct stat sb;
long blocksize;
off_t filesize;
blkcnt_t origblocks;
char *buffer;
int fd;
fd = open( filename, O_CREAT | O_RDWR, 0644 );
fstat( fd, &sb );
blocksize = sb.st_blksize;
filesize = sb.st_size;
origblocks = sb.st_blocks;
lseek( fd, 16UL * blocksize, SEEK_END );
buffer = malloc( blocksize );
memset( buffer, 0xAA, blocksize );
write( fd, buffer, blocksize );
fsync( fd );
free( buffer );
// kludge to give ZFS time to update metadata
for ( ;; )
{
stat( filename, &sb );
if ( sb.st_blocks != origblocks )
{
break;
}
}
printf( "file: %s\n filesystem: %s\n blocksize: %d\n size: %zd\n"
" blocks: %zd\n orig blocks: %zd\n disk space: %zd\n",
filename, sb.st_fstype, blocksize, sb.st_size,
( size_t ) sb.st_blocks, ( size_t ) origblocks,
( size_t ) ( 512UL * sb.st_blocks ) );
// return file to original size
ftruncate( fd, filesize );
return( 0 );
}
int main( int argc, char **argv )
{
for ( int ii = 1; ii < argc; ii++ )
{
check( argv[ ii ] );
}
return( 0 );
}
Run Code Online (Sandbox Code Playgroud)
(为了清楚起见,省略了错误检查)
启用压缩的 ZFS 似乎无法快速更新文件元数据,因此需要等待更改出现。
当在具有文件asdf(ZFS 文件系统,启用压缩)/tmp/asdf(tmpfs 文件系统)和/var/tmp/asdf(ZFS,无压缩)的 Solaris 11 机器上运行时,该代码会生成以下输出:
file: asdf
filesystem: zfs
blocksize: 131072
size: 2228224
blocks: 10
orig blocks: 1
disk space: 5120
file: /tmp/asdf
filesystem: tmpfs
blocksize: 4096
size: 69632
blocks: 136
orig blocks: 0
disk space: 69632
file: /var/tmp/asdf
filesystem: zfs
blocksize: 131072
size: 2228224
blocks: 257
orig blocks: 1
disk space: 131584
Run Code Online (Sandbox Code Playgroud)
从该输出中可以明显看出,/tmp/asdf该文件系统位于不支持稀疏文件的文件系统上,而/var/tmp/asdf位于支持此类文件的文件系统中。
而 plainasdf则完全不同,写入 128 kB 的数据会添加所有 9 512 字节的磁盘块。由此,您可以推断文件系统中正在进行某种压缩。顺便说一句,我怀疑可以很安全地假设任何支持此类本机压缩的文件系统也将支持稀疏文件。
当给定文件名或打开的文件描述符时,确定文件系统是否支持稀疏文件的最快方法是调用stat()文件名或fstat()文件描述符,st_fstype从 获取字段struct stat,并将文件的文件系统类型与一组字符串进行比较已知支持稀疏文件的文件系统类型。