Hadoop 3:如何配置/启用纠删码?

Klu*_*lun 1 hadoop bigdata hdfs erasure-code hadoop3

我正在尝试设置 Hadoop 3 集群。

关于纠删码功能的两个问题:

  1. 如何确保启用纠删码?
  2. 我还需要将复制因子设置为 3 吗?

请指出与纠删码/复制相关的配置属性,以获得与 Hadoop 2 相同的数据安全性(复制因子 3),但具有 Hadoop 3 纠删码的磁盘空间优势(仅 50% 开销,而不是 200%) 。

小智 5

在 Hadoop3 中,我们可以对 HDFS 中的任何内容启用纠删码策略folder。默认情况下,Hadoop3 中未启用纠删码,您可以通过使用setPolicy命令指定所需的文件夹路径来启用它。

1:要确保启用纠删码,您可以运行getPolicy命令。

2:在 Hadoop3 中,复制因子设置仅影响未通过纠删码 setPolicy 配置的其他文件夹。您可以在单个集群中使用纠删码和复制因子设置。

列出支持的擦除策略的命令:

./bin/hdfs ec -listPolicies

启用 XOR-2-1-1024k 擦除策略的命令:

./bin/hdfs ec -enablePolicy -policy XOR-2-1-1024k

将擦除策略设置为 HDFS 目录的命令:

./bin/hdfs ec -setPolicy -path /tmp -policy XOR-2-1-1024k

用于获取给定目录的策略集的命令:

./bin/hdfs ec -getPolicy -path /tmp

从目录中删除策略的命令。即取消设置策略:

./bin/hdfs ec -unsetPolicy -path /tmp

禁用策略的命令:

./bin/hdfs ec -disablePolicy -policy XOR-2-1-1024k


归档时间:

查看次数:

2250 次

最近记录:

7 年,7 月 前