以伪分布式hadoop模式管理hdfs

Pan*_*aj 5 hadoop hdfs

我想在我的四核机器上使用hadoop和mahout进行一些计算,所以我在伪分布式模式下使用hadoop.

问题是我的root上的空间是有限的,所以如何配置它以使用其他外部硬盘驱动器上的可用空间.

Hel*_*ann 6

您可以配置hdfs对其数据进行分支的位置.将以下内容添加到conf/hdfs-site.xml:

<property>
    <name>dfs.data.dir</name>
    <value>__path_to_where_you_want_to_store_your_data/hdfs/data/</value>
</property>
<property>
    <name>dfs.name.dir</name>
    <value>__path_to_where_you_want_to_store_your_data/hdfs/name/</value>
</property>
Run Code Online (Sandbox Code Playgroud)

在更改之后,您将必须格式化您的namenode:

hadoop namenode -format