为 Hadoop Distcp 作业设置 YARN 应用程序名称

y2k*_*ham 3 hadoop hadoop-yarn distcp

注意:我不想像HadoopYARN中那样指定 -queue 名称:为 distcp 指定纱线队列


我经常用于hadoop distcp移动数据HDFS,并希望为这些作业提供一个描述性的应用程序名称


"distcp"目前,所有复印作业仅在 UI上显示名称Resource Manager,无法区分不同的作业。

在此输入图像描述


有办法改善吗?

y2k*_*ham 6

与许多其他MR 工具一样,还允许您使用以下方式hadoop distcp传递mapred属性

-Dmapred.property.name=property-value


所以当我使用

hadoop distcp \
  -Dmapred.job.name=billing_db.replicate \
  -m 10 \
  /user/hive/warehouse/billing_db.db/ \
  s3a://my-s3-bucket/billing_db.db/
Run Code Online (Sandbox Code Playgroud)

Resource Manager它在用户界面上看起来很好

在此输入图像描述


参考