我是一名来自非 cs 背景(不是核心系统程序员)的数据分析师,在 linux 操作系统上工作。在使用 hadoop 进行分析时,我想到了一个问题,... / 是一个根,系统的所有文件都以分层方式存在。在 hadoop 环境中,有一个称为 HDFS 的特殊文件系统,它实际上是为了存储由 hadoop 编程框架处理的大文件。
hadoop -fs put localfile.txt
Run Code Online (Sandbox Code Playgroud)
虽然,这些文件应该可以在 / 下访问。那么我在哪里可以通过使用 cat、less 或 more linux 命令而无需前缀 hadoop -fs 来查看此类文件
不幸的是,如果我在 hadoop/HDFS 环境中遇到一些错误,那么我如何访问仍然驻留在我的 linux 机器上的数据。