为什么从内存映射文件读取如此之快？

Question

为什么从内存映射文件读取如此之快？

Dig*_*Eye 8 c++ windows memory-mapped-files

我对内存映射i/o没有多少经验,但是在第一次使用它们之后,我惊呆了它们的速度.在我的性能测试中,我发现从内存映射文件读取的速度比通过常规c ++ stdio读取速度快30倍.

我的测试数据是一个3GB的二进制文件,它包含20个大型双精度浮点数组.我的测试程序的结构方式,我称之为外部模块的读取方法,它使用后台的内存映射i/o.每次调用read方法时,此外部模块都会返回一个指针以及指针指向的数据大小.从这个方法返回后,我调用memcpy将返回的缓冲区的内容复制到另一个数组中.因为我做了的memcpy从内存映射文件复制数据,我希望映射存储器中读取比正常标准输入输出没有相当快,但我很惊讶,它的30X速度更快.

为什么从内存映射文件读取如此之快？

PS:我使用的是Windows机器.我对我的i/o速度进行了基准测试,机器的最大磁盘传输速率约为90 MiB/s

Answer 1

cod*_*eim 15

IO的OS内核例程,如读或写调用,仍然只是函数.编写这些函数是为了将数据复制到用户空间缓冲区或从用户空间缓冲区复制到内核空间结构,然后复制到设备.当你认为有一个用户缓冲区,一个IO库缓冲区(例如标准输入输出BUF),内核缓冲区,然后一个文件时,数据可能会潜在地经历3份程序和磁盘之间就搞定了.IO例程也必须是健壮的,最后,sys调用本身会产生延迟(陷阱到内核,上下文切换,再次唤醒进程).

当您对内存映射文件时,您正在跳过大部分内容,从而消除了缓冲区副本.通过有效地将文件视为大型虚拟阵列,您可以启用随机访问而无需通过系统调用开销,因此可以降低每个IO的延迟,如果原始代码效率低下(许多小型随机IO调用),则开销也会降低更加彻底.

虚拟内存的抽象,多处理操作系统有价格,就是这样.

但是,在某些情况下,您可以通过在知道它会损害性能(例如大型连续写入)的情况下禁用缓冲来改进IO,但除此之外,您实际上无法在不完全消除操作系统的情况下提高内存映射IO的性能.

是.同样,如果内核将您的文件映射到一组页面,并且页面不存在(尚未驻留),则内核将页面错误并直接读取这些页面. (3认同)

归档时间：	11 年，3 月前
查看次数：	3663 次
最近记录：	11 年，3 月前