当我上传文件到HDFS,如果我的复制因子设置为1,然后将文件分割会驻留在一台机器上或拆分将被分发到整个网络的多台机器?
hadoop fs -D dfs.replication=1 -copyFromLocal file.txt /user/ablimit
Run Code Online (Sandbox Code Playgroud) 我为我的文件设置了复制因子,如下所示:
hadoop fs -D dfs.replication=5 -copyFromLocal file.txt /user/xxxx
Run Code Online (Sandbox Code Playgroud)
当NameNode重新启动时,它确保在复制的块复制.因此,存储(可能在nameNode)文件的复制信息.我怎样才能获得这些信息?