Edm*_*mon 5 hdfs salt-stack apache-spark
我试过在官方Salt用户论坛上问这个,但由于某种原因我没有得到任何帮助.我希望我能在这里得到帮助.
我是Salt的新用户.我仍然在评估框架作为我们SCM工具的候选者(而不是Ansible).
我完成了本教程,并且能够成功地管理本教程前半部分所涵盖的master-minion/s关系.
教程现在分为许多不同的复杂领域.
我需要的是相对直接的,所以我希望也许有人可以在这里指导我如何实现它.
我希望在20台RHEL 7机器上安装Spark和HDFS(比如在168.192.10.0-20范围内,0是名称节点).
我知道了:
https://github.com/saltstack-formulas/hadoop-formula
我找到了第三方Spark公式:
https://github.com/beauzeaux/spark-formula
有人能够以最直接的方式提出一套关于如何进行此安装的说明吗?
免责声明:此答案仅描述了您需要做的粗略过程.我从相应的文档章节中提取了它,并添加了参考资料.我假设您熟悉Salt(状态和支柱等等)的基本工作方式以及Hadoop(我不是).
安装Salt公式的典型方法是使用GitFS.有关详细文档,请参阅Salt手册中的相应章节.
这需要在Salt主节点上完成.
在主配置文件中启用GitFS(通常/etc/salt/master或单独的文件/etc/salt/master.d):
fileserver_backend:
- git
Run Code Online (Sandbox Code Playgroud)添加您需要的两个Salt公式作为遥控器(相同的文件).这也包含在文档中:
gitfs_remotes:
- https://github.com/saltstack-formulas/hadoop-formula.git
- https://github.com/beauzeaux/spark-formula
Run Code Online (Sandbox Code Playgroud)(可选):请注意公式文档中的以下警告:
我们强烈建议将公式存储库分配到您自己的GitHub帐户,以避免对您的基础架构进行意外更改.
许多盐配方都是高度活跃的存储库,所以要小心谨慎地进行新的更改.此外,您对叉子的任何添加都可以通过快速拉动请求轻松地向上游发送!
将公式分成您自己的Git存储库(使用GitHub或其他方式),并将您的私有Git URL用作远程,以防止对您的配置进行意外更改.
重启Salt master.
这在Formulas README文件中有详细记录.从粗略的阅读中,公式可以建立Hadoop主人和奴隶; 这个角色是用盐粒决定的.
在文件中配置Hadoop角色/etc/salt/grains.这需要在每个 Salt minion节点上完成(使用hadoop_master和hadoop_slave适当):
roles:
- hadoop_master
Run Code Online (Sandbox Code Playgroud)在Salt minion上配置Salt mine(通常/etc/salt/minion或单独的文件/etc/salt/minion.d):
mine_functions:
network.interfaces: []
network.ip_addrs: []
grains.items: []
Run Code Online (Sandbox Code Playgroud)看看其他配置颗粒,并根据需要设置它们.
添加所需的支柱数据以配置Hadoop设置.为此,我们回到Salt主节点(为此,我假设您熟悉状态和支柱; 否则请参阅手册或本演练).查看可能的配置选项的示例支柱.
使用hadoop和中的hadoop.hdfs状态top.sls:
'your-hadoop-hostname*':
- hadoop
- hadoop.hdfs
Run Code Online (Sandbox Code Playgroud)根据公式的自述文件,没有什么可以通过谷物或支柱配置,所以剩下的就是使用spark你的状态top.sls:
'your-hadoop-hostname*':
- hadoop
- hadoop.hdfs
- spark
Run Code Online (Sandbox Code Playgroud)应用所有州:
salt 'your-hadoop-hostname*' state.highstate
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
1052 次 |
| 最近记录: |