解除节点是否会从该节点中删除数据?

sch*_*mmd 5 hadoop

在Hadoop中,如果我停用一个节点,Hadoop将在整个群集中重新分发文件,以便正确复制它们.是否会从已退出的节点中删除数据?

我试图平衡特定节点上的磁盘数据.我计划通过解除节点然后重新组合节点来做到这一点.在退役完成后,是否需要从该节点删除数据,或者仅仅重新安装它(将其从排除文件中删除并运行hadoop dfsadmin -refreshNodes)是否足够?

更新:它为我解除节点,删除该节点上的所有数据,然后重新安装它.

Tar*_*riq 1

AFAIK,当您停用 DataNode 时,数据不会从 DataNode 中删除。但无法对该 DataNode 进行进一步写入。当您停用 DataNode 时,该 DataNode 持有的副本将被标记为“停用”副本,这些副本仍然可以进行读取访问。

但是为什么要执行此停用/重新启用周期?为什么不将所有磁盘指定为 hdfs-site.xml 中的 dfs.data.dir 属性的逗号分隔值,然后重新启动 DataNode 守护程序。重新启动后运行平衡器。