如何检查 HDFS 上文件的格式?

tom*_*eep 5 hadoop hdfs

给出一个 HDFS 路径,如何确定它是什么格式(文本、序列或镶木地板)?

yjs*_*hen 5

我认为完成您的需求并不容易,除非您在 HDFS 中的所有文件都遵循一些约定,例如.txt文本、.seq序列和.parquet镶木地板文件。

但是,您可以使用cat.

  • HDFS cat:hadoop dfs -cat /path/to/file | head检查它是否是文本文件。

  • 镶木地板头:镶木地板工具头 [选项...] /path/to/file

  • 或者,写一个程序来阅读......