Dut*_*tta 7 hadoop mapreduce hadoop-yarn
我正在学习hadoop并且对默认端口和位置感到困惑.
当我点击URL:localhost:50070给出了hdfs信息的结果.在hadoop文档中,以下是一些提到的端口.
HDFS-default.xml中
dfs.datanode.http.address 0.0.0.0:50075
dfs.datanode.address 0.0.0.0:50010
dfs.namenode.http-address 0.0.0.0:50070
dfs.namenode.backup.http-address 0.0.0.0:50105
Run Code Online (Sandbox Code Playgroud)
mapred-default.xml中
mapreduce.jobtracker.http.address 0.0.0.0:50030
mapreduce.tasktracker.http.address 0.0.0.0:50060
Run Code Online (Sandbox Code Playgroud)
纱default.xml中
yarn.resourcemanager.address ${yarn.resourcemanager.hostname}:8032
yarn.resourcemanager.webapp.address ${yarn.resourcemanager.hostname}:8088
Run Code Online (Sandbox Code Playgroud)
现在,在我的机器中配置Hadoop 2时,我做了:$ cd/usr/local/hadoop/etc/hadoop $ vi core-site.xml
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
Run Code Online (Sandbox Code Playgroud)
问题:默认情况下提到了很多端口,文档中有其他xml ....
1)localhost:50070只返回一些含义完整数据(hdfs health)的其他端口怎么样.其他人只是不回信息?
2)在yarn-default.xml中都是资源管理器端口,区别在于一个是webapp端口.只有当我点击localhost:8088时,它才会给出集群(本例中是单节点)信息.那么端口8083是什么?在示例代码中,我看到8083是RM端口.我不清楚.有人可以解释一下
3)我将hdfs端口更改为9000是那个标准吗?
4)如何查看appmaster,jobtracker,tasktracker端口
5)我认为在纱线hadoop 2中没有jobtracker和tasktracker那么这些端口的目的是什么?
我正在做这些基本问题的噩梦......
谢谢,阿米特
小智 0
Amit,hadoop 正在监控很多端口,此外还有很多 hadoop 守护进程。每个端口都出于特定原因监视特定端口(您可以覆盖这些端口)。该文档列出了端口及其用途。例如,Hadoop 2 中的资源管理器 YARN 有一个用于监视作业提交的端口:yarn.resourcemanager.address。您可以在conf/yarn-site.xml 中覆盖该端口(不要)。它还使用一个端口yarn.resourcemanager.webapp.address作为其用户界面,另一个端口yarn.resourcemanager.admin.address用于管理命令。同样,HDFS 监控 50070 作为其 Web 地址,并返回有关文件系统的信息。一般来说,最好不要管端口,因为人们知道众所周知的端口号并期望它们(您不会期望默认端口 telnet 或 ftp 会移动)。请记住,yarn 和 MR 可以在同一个集群上运行。有些发行版两者都有。
归档时间: |
|
查看次数: |
12168 次 |
最近记录: |