我试图运行Tom Whites的第2章示例
当我运行命令时:
hadoop MaxTemperature input/ncdc/sample.txt output
Run Code Online (Sandbox Code Playgroud)
我得到的错误是这样的:
11/12/31 18:08:28 INFO mapred.JobClient: Cleaning up the staging area hdfs://localhost:9000/tmp/hadoop-mymac/mapred/staging/mymac/.staging/job_201112311807_0001
11/12/31 18:08:28 ERROR security.UserGroupInformation: PriviledgedActionException as:mymac (auth:SIMPLE) cause:org.apache.hadoop.mapreduce.lib.input.InvalidInputException: Input path does not exist: hdfs://localhost:9000/user/mymac/input/ncdc/sample.txt
Exception in thread "main" org.apache.hadoop.mapreduce.lib.input.InvalidInputException: Input path does not exist: hdfs://localhost:9000/user/mymac/input/ncdc/sample.txt
Run Code Online (Sandbox Code Playgroud)
我错了什么?
我没有触及他的源代码,可以在这里找到:
您core-site.xml和hdfs-site.xml文件配置为使用localhost:9000.如果这不是你所期望的(这是我从你文章的标题获得),什么没有你期待什么?
我们在谈论什么版本的Hadoop?您是如何安装Hadoop发行版的?从你的其他问题和配置文件,我猜你用过CHD4.如果你查看Cloudera的说明,你能看到你错过了什么吗?
在启动Hadoop之前,您是否格式化了HDFS?
$ hadoop namenode -format
Run Code Online (Sandbox Code Playgroud)
然后,在启动Hadoop之后,除了INFO消息之外你还得到什么吗?
您是否将输入数据复制到HDFS?
$ hadoop dfs -put /tmp/my/input/data input
Run Code Online (Sandbox Code Playgroud)
最后,您从简单的HDFS命令中获得了什么,例如:
$ hadoop dfs -ls /
Run Code Online (Sandbox Code Playgroud)
更新:运行字数
hadoop dfs -ls /应该有效.hadoop dfs -put text_files input_folderhadoop dfs -ls .以查看您的文件是否已正确复制.hadoop-examples-X.Y.Z.jar在系统上找到该文件.导航到它所在的目录,然后运行:
$ hadoop jar hadoop-examples-*.jar WordCount input_folder output_folder.
您应该看到MapReduce应用程序的进度.
hadoop dfs -cat output_folder/*.| 归档时间: |
|
| 查看次数: |
16468 次 |
| 最近记录: |