Elasticsearch path.data 多个磁盘,添加更多

rb1*_*980 5 elasticsearch

当我最初设置我的 Elasticsearch 集群时,建议这样在多个磁盘上“条带化”数据:

path.data: [ /disk1, /disk2, /disk3 ]

我以前做过,并且工作正常,但现在我需要添加更多空间(更多磁盘),我计划这样做:

path.data: [ /disk1, /disk2, /disk3, /disk4, /disk5 ]

我还没有找到任何权威参考来表明数据将如何重新平衡(或不平衡)。多年来/版本的行为似乎有所改变,因此谷歌搜索一直很困难。所有文档都说:“path.data 设置可以设置为多个路径,在这种情况下,所有路径都将用于存储数据”,这是相当模糊的。

我正在运行 Elasticsearch 5.6。

我想了解当磁盘 1、2、3 高于 85% 的“低水位线”(但尚未达到 90% 的高位标记)时会发生什么,并且我向组合中引入了 2 个新磁盘。新索引是否只会出现在 2 个新磁盘上?

文档说:“一旦节点使用了超过 85% 的磁盘,ES 就不会将新的分片分配给节点”。这是指整个节点,还是仅指该节点上 85% 的磁盘?

我的索引是每日日志数据,每 N 天用 Curator 修剪一次,所以我想在某个时候,事情会趋于平衡,但可能需要一段时间。有什么方法可以主动将分片重新定位到不同的磁盘,还是应该让它随着时间的推移自我平衡?

JBB*_*JBB 0

使用多个磁盘(通过数据路径)不是剥离。数据按分片数量而不是磁盘空间使用情况分布在磁盘上。即使单个磁盘超过水位线,节点也会受到影响。因此,将新磁盘添加到数据路径不会将数据分发到新磁盘。

要使用数据条带化,请根据您的数据安全要求至少使用 RAID0 或其他选项。

REFER数据存储架构