elasticsearch 压缩数据的效果如何?

cmo*_*key 6 compression elasticsearch

我希望确定弹性搜索概念验证所需的服务器范围。

最后,我的问题是:

给定由 elasticsearch 索引的 1GB json 文本,我可以期望在磁盘上被 elasticsearch 占用多少?

显然有很多变数,但我要的是数量级。100MB?100GB?

我知道 elasticsearch 执行压缩(http://www.elasticsearch.org/guide/reference/index-modules/store/),但我不知道索引和其他结构占用什么样的足迹。

轶事答案是可以接受的,但也请让我知道您使用的是哪个版本。

Tra*_*ell 7

答案是:视情况而定。

在 Elasticsearch 工作Adrien Grand 的一篇博客文章从 Lucene 的角度对此做了一些基准测试。看起来他的进步大约是 2 倍。

他还提到了LUCENE-4226,其中一些底层压缩工作已经完成。其中列出了一些基准测试,比较了测试的各种压缩算法。

同样,根据Elasticsearch 0.19.5 发布公告,商店级压缩似乎默认为 LZF,而 Snappy 将在未来某个时候推出。进一步查看发现 Snappy 实验支持出现在 0.19.9