小编San*_*aka的帖子

如何在 Apache Spark 中删除以某个单词开头的多个 hdfs 目录

我使用dstream.saveAsObjectFiles("/temObj")它在 hdfs 中显示多个文件的方法在火花流中保留了对象文件。

temObj-1506338844000
temObj-1506338848000
temObj-1506338852000
temObj-1506338856000
temObj-1506338860000
Run Code Online (Sandbox Code Playgroud)

阅读完所有文件后,我想删除所有 temObj 文件。在火花中做到这一点的最佳方式是什么?我试过

val hdfs = org.apache.hadoop.fs.FileSystem.get(new java.net.URI("hdfs://localhost:9000"), hadoopConf)
hdfs.delete(new org.apache.hadoop.fs.Path(Path), true) 
Run Code Online (Sandbox Code Playgroud)

但它一次只能删除一个文件夹

hadoop scala hdfs apache-spark spark-streaming

1
推荐指数
1
解决办法
4157
查看次数

标签 统计

apache-spark ×1

hadoop ×1

hdfs ×1

scala ×1

spark-streaming ×1