我必须对一大堆文件进行大量的随机访问.我有足够的主内存来容纳所有数据.
当我将数据复制到临时ramfs文件系统并在那里进行处理时,这只需要等待磁盘访问的一小部分时间.
是否有一个Linux文件系统将所有数据保存在主内存中,将任何更改写入后备磁盘,但从不接触磁盘进行任何读取?
如果没有,可以说,可以调整ext3缓存,以确保它们能够保存100%的数据和元数据吗?
我将编写一些示例应用程序和附带的文档,比较访问存储在关系数据库中的信息的方法.为了展示现实生活中的要求,我需要包含数十万个事实的真实数据集.
是否有人了解这种规模的公开可用数据集,具有人类差异的人名数据集,或大型组织层次结构的分层数据集,或大型分层,分类的产品目录?
如果你是的话,请指出正确的方向.
第1部分,人名:http://timecenter.cs.aau.dk/software.htm
第2部分,分层数据:还没有答案