小编San*_*aka的帖子

如何在 Apache Spark 中删除以某个单词开头的多个 hdfs 目录

我使用dstream.saveAsObjectFiles("/temObj")它在 hdfs 中显示多个文件的方法在火花流中保留了对象文件。

temObj-1506338844000
temObj-1506338848000
temObj-1506338852000
temObj-1506338856000
temObj-1506338860000

Run Code Online (Sandbox Code Playgroud)

阅读完所有文件后，我想删除所有 temObj 文件。在火花中做到这一点的最佳方式是什么？我试过

val hdfs = org.apache.hadoop.fs.FileSystem.get(new java.net.URI("hdfs://localhost:9000"), hadoopConf)
hdfs.delete(new org.apache.hadoop.fs.Path(Path), true)

Run Code Online (Sandbox Code Playgroud)

但它一次只能删除一个文件夹

hadoop scala hdfs apache-spark spark-streaming

San*_*aka

lucky-day

1
推荐指数

1
解决办法

4157
查看次数

标签统计

apache-spark ×1

hadoop ×1

hdfs ×1

scala ×1

spark-streaming ×1

如何在 Apache Spark 中删除以某个单词开头的多个 hdfs 目录

标签 统计

小编San_aka的帖子

标签统计