本地文件系统上的Hadoop

Lea*_*ner 5 filesystems hadoop hdfs

我在伪分布式上运行Hadoop.我想通过为我的工作提取HDFS来从本地文件系统中读取和写入.我正在使用file:///参数.我按照这个链接.

这是文件内容core-site.xml,

<configuration>
 <property>
  <name>hadoop.tmp.dir</name>
  <value> /home/abimanyu/temp</value>   
 </property>

 <property>
  <name>fs.default.name</name>
  <value>hdfs://localhost:54310</value>
 </property>

</configuration>
Run Code Online (Sandbox Code Playgroud)

这是文件内容mapred-site.xml,

<configuration>

 <property>
  <name>mapred.job.tracker</name>
  <value>localhost:54311</value>
 </property>

 <property>
    <name>fs.default.name</name>
    <value>file:///</value>
 </property>

 <property>
    <name>mapred.tasktracker.map.tasks.maximum</name>
    <value>1</value>
 </property>

 <property>
    <name>mapred.tasktracker.reduce.tasks.maximum</name>
    <value>1</value>
 </property>

</configuration>
Run Code Online (Sandbox Code Playgroud)

这是文件内容hdfs-site.xml,

<configuration>

 <property>
  <name>dfs.replication</name>
  <value>1</value>
 </property>
</configuration>
Run Code Online (Sandbox Code Playgroud)

这是我尝试启动恶魔时使用的错误(使用start-dfs或start-all),

localhost: Exception in thread "main" java.lang.IllegalArgumentException: Does not contain a valid host:port authority: file:///
localhost:      at org.apache.hadoop.net.NetUtils.createSocketAddr(NetUtils.java:164)
localhost:      at org.apache.hadoop.hdfs.server.namenode.NameNode.getAddress(NameNode.java:212)
localhost:      at org.apache.hadoop.hdfs.server.namenode.NameNode.getAddress(NameNode.java:244)
localhost:      at org.apache.hadoop.hdfs.server.namenode.NameNode.getServiceAddress(NameNode.java:236)
localhost:      at org.apache.hadoop.hdfs.server.namenode.SecondaryNameNode.initialize(SecondaryNameNode.java:194)
localhost:      at org.apache.hadoop.hdfs.server.namenode.SecondaryNameNode.<init>(SecondaryNameNode.java:150)
localhost:      at org.apache.hadoop.hdfs.server.namenode.SecondaryNameNode.main(SecondaryNameNode.java:676)
Run Code Online (Sandbox Code Playgroud)

对我来说奇怪的是,从本地文件系统读取的内容完全正常,hadoop-0.20.2但不是 hadoop-1.2.1.从初始版本到更高版本有什么变化吗?让我知道如何从本地文件系统中读取Hadoop JAR.

Chr*_*ite 6

您可以从mapred-site.xml文件中删除fs.default.name值 - 这应该只在core-site.xml文件中.

如果要在本地文件系统上以伪模式运行,通常可以通过在所谓的本地模式下运行来实现 - 通过将core-site.xml中的fs.default.name值设置为file:///(您目前已将其配置为hdfs:// localhost:54310).

您看到的堆栈跟踪是辅助名称节点启动时 - 在"本地模式"下运行时不需要这样,因为没有用于2NN的fsimage或编辑文件.

修复core-site.xml和mapred-site.xml.停止所有hadoop守护进程,然后启动map-reduce守护进程(Job Tracker和Task Tracker).