伪模式中没有namenode错误

Question

伪模式中没有namenode错误

我是hadoop的新手,正处于学习阶段.根据Hadoop Definitve指南,我已经在伪分布式模式下设置了我的hadoop,一切正常.我甚至能够执行昨天第3章的所有例子.今天,当我重新启动我的unix并尝试运行start-dfs.sh然后尝试localhost:50070 ...它显示错误,当我尝试停止dfs(stop-dfs.sh)时,它说没有要停止的namenode.我一直在谷歌上搜索这个问题但没有结果.此外,当我再次格式化我的namenode ...一切都开始工作正常,我能够连接到localhost:50070,甚至复制hdfs中的文件和目录,但一旦我重新启动我的Linux并尝试连接到hdfs同样的问题出现了.

以下是错误日志:

************************************************************/
2011-06-22 15:45:55,249 INFO org.apache.hadoop.hdfs.server.namenode.NameNode: STARTUP_MSG:
/************************************************************
STARTUP_MSG: Starting NameNode
STARTUP_MSG:   host = ubuntu/127.0.1.1
STARTUP_MSG:   args = []
STARTUP_MSG:   version = 0.20.203.0
STARTUP_MSG:   build = http://svn.apache.org/repos/asf/hadoop/common/branches/branch-0.20-security-203 -r 1099333; compiled by 'oom' on Wed May  4 07:57:50 PDT 2011
************************************************************/
2011-06-22 15:45:56,383 INFO org.apache.hadoop.metrics2.impl.MetricsConfig: loaded properties from hadoop-metrics2.properties
2011-06-22 15:45:56,455 INFO org.apache.hadoop.metrics2.impl.MetricsSourceAdapter: MBean for source MetricsSystem,sub=Stats registered.
2011-06-22 15:45:56,494 INFO org.apache.hadoop.metrics2.impl.MetricsSystemImpl: Scheduled snapshot period at 10 second(s).
2011-06-22 15:45:56,494 INFO org.apache.hadoop.metrics2.impl.MetricsSystemImpl: NameNode metrics system started
2011-06-22 15:45:57,007 INFO org.apache.hadoop.metrics2.impl.MetricsSourceAdapter: MBean for source ugi registered.
2011-06-22 15:45:57,031 WARN org.apache.hadoop.metrics2.impl.MetricsSystemImpl: Source name ugi already exists!
2011-06-22 15:45:57,059 INFO org.apache.hadoop.metrics2.impl.MetricsSourceAdapter: MBean for source jvm registered.
2011-06-22 15:45:57,070 INFO org.apache.hadoop.metrics2.impl.MetricsSourceAdapter: MBean for source NameNode registered.
2011-06-22 15:45:57,374 INFO org.apache.hadoop.hdfs.util.GSet: VM type       = 32-bit
2011-06-22 15:45:57,374 INFO org.apache.hadoop.hdfs.util.GSet: 2% max memory = 19.33375 MB
2011-06-22 15:45:57,374 INFO org.apache.hadoop.hdfs.util.GSet: capacity      = 2^22 = 4194304 entries
2011-06-22 15:45:57,374 INFO org.apache.hadoop.hdfs.util.GSet: recommended=4194304, actual=4194304
2011-06-22 15:45:57,854 INFO org.apache.hadoop.hdfs.server.namenode.FSNamesystem: fsOwner=anshu
2011-06-22 15:45:57,854 INFO org.apache.hadoop.hdfs.server.namenode.FSNamesystem: supergroup=supergroup
2011-06-22 15:45:57,854 INFO org.apache.hadoop.hdfs.server.namenode.FSNamesystem: isPermissionEnabled=true
2011-06-22 15:45:57,868 INFO org.apache.hadoop.hdfs.server.namenode.FSNamesystem: dfs.block.invalidate.limit=100
2011-06-22 15:45:57,869 INFO org.apache.hadoop.hdfs.server.namenode.FSNamesystem: isAccessTokenEnabled=false accessKeyUpdateInterval=0 min(s), accessTokenLifetime=0 min(s)
2011-06-22 15:45:58,769 INFO org.apache.hadoop.hdfs.server.namenode.FSNamesystem: Registered FSNamesystemStateMBean and NameNodeMXBean
2011-06-22 15:45:58,809 INFO org.apache.hadoop.hdfs.server.namenode.NameNode: Caching file names occuring more than 10 times
**2011-06-22 15:45:58,825 INFO org.apache.hadoop.hdfs.server.common.Storage: Storage directory /tmp/hadoop-anshu/dfs/name does not exist.
2011-06-22 15:45:58,827 ERROR org.apache.hadoop.hdfs.server.namenode.FSNamesystem: FSNamesystem initialization failed.
org.apache.hadoop.hdfs.server.common.InconsistentFSStateException: Directory /tmp/hadoop-anshu/dfs/name is in an inconsistent state: storage directory does not exist or is not accessible.
    at org.apache.h**adoop.hdfs.server.namenode.FSImage.recoverTransitionRead(FSImage.java:291)
    at org.apache.hadoop.hdfs.server.namenode.FSDirectory.loadFSImage(FSDirectory.java:97)
    at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.initialize(FSNamesystem.java:379)
    at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.<init>(FSNamesystem.java:353)
    at org.apache.hadoop.hdfs.server.namenode.NameNode.initialize(NameNode.java:254)
    at org.apache.hadoop.hdfs.server.namenode.NameNode.<init>(NameNode.java:434)
    at org.apache.hadoop.hdfs.server.namenode.NameNode.createNameNode(NameNode.java:1153)
    at org.apache.hadoop.hdfs.server.namenode.NameNode.main(NameNode.java:1162)
2011-06-22 15:45:58,828 ERROR org.apache.hadoop.hdfs.server.namenode.NameNode: org.apache.hadoop.hdfs.server.common.InconsistentFSStateException: Directory /tmp/hadoop-anshu/dfs/name is in an inconsistent state: storage directory does not exist or is not accessible.
    at org.apache.hadoop.hdfs.server.namenode.FSImage.recoverTransitionRead(FSImage.java:291)
    at org.apache.hadoop.hdfs.server.namenode.FSDirectory.loadFSImage(FSDirectory.java:97)
    at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.initialize(FSNamesystem.java:379)
    at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.<init>(FSNamesystem.java:353)
    at org.apache.hadoop.hdfs.server.namenode.NameNode.initialize(NameNode.java:254)
    at org.apache.hadoop.hdfs.server.namenode.NameNode.<init>(NameNode.java:434)
    at org.apache.hadoop.hdfs.server.namenode.NameNode.createNameNode(NameNode.java:1153)
    at org.apache.hadoop.hdfs.server.namenode.NameNode.main(NameNode.java:1162)

2011-06-22 15:45:58,829 INFO org.apache.hadoop.hdfs.server.namenode.NameNode: SHUTDOWN_MSG:
/************************************************************
SHUTDOWN_MSG: Shutting down NameNode at ubuntu/127.0.1.1
************************************************************/

Run Code Online (Sandbox Code Playgroud)

任何帮助表示感谢谢谢

Answer 1

jsh*_*jsh 14

这是踢球者:

org.apache.hadoop.hdfs.server.common.InconsistentFSStateException:目录/ tmp/hadoop-anshu/dfs/name处于不一致状态:存储目录不存在或无法访问.

我一直有类似的问题.我用stop-all.sh来关闭hadoop.我想我认为这样可以正确保存我的HDFS中的数据是愚蠢的.

但据我所知,似乎是hadoop-daemon.sh脚本中的相应代码块,情况并非如此 - 它只会杀死进程:

(stop)

    if [ -f $pid ]; then
      if kill -0 `cat $pid` > /dev/null 2>&1; then
        echo stopping $command
        kill `cat $pid`
      else
        echo no $command to stop
      fi
    else
      echo no $command to stop
    fi

Run Code Online (Sandbox Code Playgroud)

你看看它抱怨的目录是否存在？我检查过但我的没有,虽然这里有一个(空!)数据文件夹,我想象数据可能曾经存在过.

所以我的猜测是我们需要做的是配置Hadoop,使得我们的namenode和datanode不存储在tmp目录中.操作系统有可能正在进行维护并删除这些文件.要么那个hadoop数字,你不再关心它们了,因为你不会把它们留在tmp目录中,如果你这样做了,你就不会在map-reduce工作中重新启动你的机器.我真的不认为这应该发生(我的意思是,这不是我设计的方式),但这似乎是一个很好的猜测.

所以,基于这个网站http://wiki.datameer.com/display/DAS11/Hadoop+configuration+file+templates 我编辑我的conf/hdfs-site.xml文件指向以下路径(显然,制作你自己的你觉得合适的目录):

<property>
  <name>dfs.name.dir</name>
  <value>/hadoopstorage/name/</value>
</property>

<property>
  <name>dfs.data.dir</name>
  <value>/hadoopstorage/data/</value>
</property>

Run Code Online (Sandbox Code Playgroud)

这样做了,格式化了新的namenode(遗憾的是,在这种情况下数据丢失似乎是不可避免的),停止并使用shell脚本启动hadoop,重启机器,我的文件仍在那里......

YMMV ...希望这对你有用!我在OS X上,但我不认为你应该有不同的结果.

Ĵ

Answer 2

Nix*_*Nix 8

如果你不关心丢失数据,只需执行命令:

./hadoop namenode -format

Run Code Online (Sandbox Code Playgroud)

是的,但他仍在努力解决问题,大概是因为他可以开始本地开发.另外,如果你阅读帖子,他已经说过,当他重新格式化名称节点时,事情就会起作用,但这可能不足以满足他的需求,或者他不会发布问题.-j (2认同)

Answer 3

小智 5

我有类似的问题,这有帮助

chown -R hdfs:hadoop /path/to/namenode/date/dir

Run Code Online (Sandbox Code Playgroud)

归档时间：	14 年，4 月前
查看次数：	14708 次
最近记录：	9 年，3 月前