小型分布式计算集群

13 linux cluster distributed-filesystem

我是一名高中生,试图为一个项目构建一个 linux 集群(今年夏天我有一堆不错的计算机准备重新映像,所以技术部门基本上说只要我不破坏它们,我就可以做任何事。

无论如何,我对构建集群一无所知,但我对 Linux 非常熟悉。

我需要知道这些事情: - 我应该使用什么发行版?它甚至重要吗?- 什么软件可以配置集群?- 机载或分布式 FS?- 任何可以提供体面指南或操作方法的网站?

gab*_*be. 7

这实际上取决于您要实现的目标,以及您所说的“分布式计算集群”是什么意思。我曾经在 Uni 中使用旧机器和PVM做了类似的事情,从一堆机器作为一台计算机进行并行处理的意义上说,这是“集群”——想想 Beowulf 集群。当然,您需要编写代码来利用这一点。

一个好的起点是确定您希望通过该项目学习什么。我建议初学者阅读有关并行计算的维基百科文章,然后根据您想要做什么来完善您的需求。

一个简单的作业排队系统(如gearman)可能足以快速获得一些很酷的结果。

我在制作并行计算集群时遇到的问题是,我没有任何事情可做,它基本上只是坐在那里,但这是一个有趣的项目,我学到了很多东西。无论如何,无论您选择实施什么,您都可能在学习的同时获得乐趣。

至于发行版的选择,我会选择我最喜欢的,因为您可能需要从源代码安装东西。一旦您对所有设置都感到满意,那么您就可以寻找更适合您需求的发行版。但是任何发行版都应该这样做。

用什么软件配置集群?这完全取决于您创建的集群类型。

机载与分布式 FS?同样,这取决于您的集群的要求是什么。每个节点是否会在其他节点之间来回传递数据?它们会作为一个主人的奴隶运作吗?他们会完全独立运作吗?这些问题将开始影响您的选择。当然,总有取舍。

其他一些可能很有趣的链接:

http://hadoop.apache.org/

http://www.csm.ornl.gov/oscar/

https://computing.llnl.gov/tutorials/parallel_comp/

http://www.google.com/Top/Computers/Parallel_Computing/Programming/Environments/

http://www.google.com/Top/Computers/Parallel_Computing/Beowulf/


aso*_*ove -1

尝试Linux HA(高可用性),它是一个免费提供的 Linux 集群解决方案,可在多个发行版上运行。

这可能只是多种解决方案之一。我不知道它与其他软件相比如何,甚至不知道它的具体功能是什么,我只知道一些工友坚信它是严肃的商业软件。