ser*_*erg 20 hadoop hdfs hortonworks-data-platform
我刚刚下载了Hortonworks沙盒VM,里面有Hadoop版本2.7.1.我通过使用添加一些文件
hadoop fs -put /hw1/* /hw1
Run Code Online (Sandbox Code Playgroud)
...命令.之后我将删除添加的文件
hadoop fs -rm /hw1/*
Run Code Online (Sandbox Code Playgroud)
...命令,并在清理回收站后,通过
hadoop fs -expunge
Run Code Online (Sandbox Code Playgroud)
...命令.但是在重新清洗后,DFS剩余空间没有改变.即使我可以看到数据真的从/ hw1 /和recyle bin中删除了.我有fs.trash.interval parameter = 1.
实际上我可以在/hadoop/hdfs/data/current/BP-2048114545-10.0.2.15-1445949559569/current/finalized/subdir0/subdir2文件夹中找到所有我的数据分块,这真的让我感到惊讶,因为我希望它们被删除.
那么我的问题是如何以真正删除的方式删除数据?经过几次添加和删除后,我的空闲空间耗尽了.
Gio*_*ous 10
您可以使用
hdfs dfs -rm -R /path/to/HDFS/file
Run Code Online (Sandbox Code Playgroud)
因为hadoop dfs已被弃用。
什么对我有用:
hadoop fs -rmr -R <your Directory>
Run Code Online (Sandbox Code Playgroud)
小智 5
如果您还需要跳过垃圾,以下命令对我有用
hdfs dfs -rm -R -skipTrash /path/to/HDFS/file
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
59751 次 |
| 最近记录: |