KoW*_*KoW 6 java xml file riak
我正在寻找一种存储和检索数百万个xml文件的简单方法.目前一切都在文件系统中完成,这有一些性能问题.
我们的要求是:
我确实看过几个NoSQL平台(例如CouchDB,Riak等),虽然这些系统看起来很棒,但它们看起来几乎像过度杀戮一样:
深入研究Riak之后,我找到了Bitcask(见介绍),这看起来就像我想要的那样.介绍中描述的基础知识非常有趣.但不幸的是,没有办法通过java访问bitcask repo(或者在那里?)
所以,我的问题归结为
我不认为Bitcask能够很好地适应你的用例.看起来Bitcask模型是针对每个值的大小相对较小的用例而设计的.
问题出在Bitcask的数据文件合并过程中.这涉及将所有实时值从多个"旧数据文件"复制到"合并数据文件"中.如果你在每个100Kb的区域内有数百万的值,这是一个疯狂的数据复制量.
小智 5
Bitcask 可能适合这种情况(较大的值),具体取决于是否存在大量覆盖。特别是,除非存在大量浪费的空间,否则没有理由合并文件,这种情况仅在新值与旧值具有相同键的情况下出现。
Bitcask 特别适合这种批量加载情况,因为它将按顺序将传入数据流直接写入磁盘。在大多数情况下,查找将进行一次查找,但如果存在任何时间局部性,文件缓存将帮助您。
我不确定 Java 版本/包装器的状态。