我正在设置Hadoop(0.20.2).对于初学者,我只是希望它在一台机器上运行 - 我可能在某个时候需要一个集群,但是当我到达那里时我会担心.我得到了我的客户端代码可以连接到作业跟踪器并启动作业的点,但是有一个问题:作业跟踪器只能从它运行的同一台机器上访问.我实际上使用nmap进行了端口扫描,它在从Hadoop机器扫描时显示端口9001打开,并在从其他地方扫描时关闭.
我在三台机器(一台Mac,一台Ubuntu和一台运行在VirtualBox上的Ubuntu VM)上试过这个,它是一样的.他们都没有设置任何防火墙,所以我很确定这是一个Hadoop问题.有什么建议?
在您的Hadoop配置文件,也fs.default.name并mapred.job.tracker指本地主机?
如果是这样,那么Hadoop将仅在环回接口上侦听端口9000和9001,这是任何其他主机都无法访问的.确保fs.default.name并mapred.job.tracker参考机器的外部可访问主机名.