Hadoop 2.2.0中HDFS的配置文件在哪里?

dan*_*emi 14 configuration hadoop configuration-files hdfs

我正在研究Hadoop,目前我正在尝试建立一个Hadoop 2.2.0单节点.我下载了最新的发行版,未压缩它,现在我正在尝试设置Hadoop分布式文件系统(HDFS).

现在,我正在尝试遵循这里提供的Hadoop指令,但我很遗憾.

在左侧栏中,您会看到对以下文件的引用:

  • 核心default.xml中
  • HDFS-default.xml中
  • mapred-default.xml中
  • 纱default.xml中

但这些文件是怎样的?

我找到了/etc/hadoop/hdfs-site.xml,但它是空的!

我找到了/share/doc/hadoop/hadoop-project-dist/hadoop-common/core-default.xml,但它只是一个文档!

那么,我需要修改哪些文件才能配置HDFS?从哪里读取deaults值?

在此先感谢您的帮助.

Evg*_*tov 17

这些文件都在hadoop/conf目录中找到.

要设置HDFS,您必须配置core-site.xml和hdfs-site.xml.

HDFS以两种模式工作:分布式(多节点集群)和伪分布式(一台机器集群).

对于伪分布式模式,您必须配置:

在core-site.xml中:

<!-- namenode -->
<property>
  <name>fs.default.name</name>
  <value>hdfs://localhost:8020</value>
</property>
Run Code Online (Sandbox Code Playgroud)

在hdfs-site.xml中:

<-- storage directories for HDFS - the hadoop.tmp.dir property, whose default is /tmp/hadoop-${user.name} -->
<property>
    <name>hadoop.tmp.dir</name>
    <value>/your-dir/</value>
</property>
Run Code Online (Sandbox Code Playgroud)

每个属性都有其硬编码的默认值.

请记住在启动HDFS之前为hadoop用户设置ssh无密码登录.

PS

你从Apache下载Hadoop,你可以考虑切换到Hadoop发行版:

Cloudera的CDH,HortonWorks或MapR.

如果您安装Cloudera CDH或Hortonworks HDP,您将在/ etc/hadoop/conf /中找到这些文件.


Rus*_*ade 5

对于安装Hadoop 2.2.0,请单击此链接.这是"0.23.9",但它对"2.2.0"绝对正常


Ind*_*our 5

对于 Hortonworks 来说,位置是

/etc/hadoop/conf/hdfs-site.xml
Run Code Online (Sandbox Code Playgroud)