y2k*_*ham 3 hadoop hadoop-yarn distcp
注意:我不想像HadoopYARN中那样指定 -queue 名称:为 distcp 指定纱线队列
我经常用于hadoop distcp移动数据HDFS,并希望为这些作业提供一个描述性的应用程序名称。
"distcp"目前,所有复印作业仅在 UI上显示名称Resource Manager,无法区分不同的作业。
有办法改善吗?
与许多其他MR 工具一样,还允许您使用以下方式hadoop distcp传递mapred属性
-Dmapred.property.name=property-value
所以当我使用
hadoop distcp \
-Dmapred.job.name=billing_db.replicate \
-m 10 \
/user/hive/warehouse/billing_db.db/ \
s3a://my-s3-bucket/billing_db.db/
Run Code Online (Sandbox Code Playgroud)
Resource Manager它在用户界面上看起来很好
参考
| 归档时间: |
|
| 查看次数: |
2362 次 |
| 最近记录: |