标签: high-availability

ZooKeeper替代品？(集群协调服务)

ZooKeeper是一种高度可用的数据中心协调服务.它起源于Hadoop项目.可以在其上实现锁定,故障转移,领导者选举,组成员资格和其他协调问题.ZooKeeper还有其他选择吗？(当然是自由软件)

locking high-availability cluster-computing heartbeat apache-zookeeper

Tho*_*och

lucky-day

70
推荐指数

6
解决办法

4万
查看次数

Web App:高可用性/如何防止单点故障？

有人可以向我解释高可用性("HA")如何适用于Web应用程序......因为我认为HA意味着不存在单点故障.

但是,即使使用了负载均衡器,这不是单点故障吗？

load-balancing high-availability cluster-computing uptime

nic*_*ckb

2012 01-04

46
推荐指数

2
解决办法

2万
查看次数

Redis主/从复制 - 单点故障？

如何在没有停机时间的情况下升级到更新版本的Redis？Redis从站是只读的,因此您似乎必须取下主站,并且在您等待重新加载数据库时,您的站点将是只读45秒或更长时间.

有没有解决的办法？

high-availability redis

nor*_*gon

2011 01-18

37
推荐指数

4
解决办法

3万
查看次数

如何保证Celery的邮件传递？

我有一个python应用程序,我想在后台开始做更多工作,以便它变得更加繁忙,因为它变得更加繁忙.在过去,我使用Celery来完成正常的后台任务,这一点运作良好.

这个应用程序和我过去做过的其他应用程序之间的唯一区别是我需要保证这些消息得到处理,它们不会丢失.

对于这个应用程序,我不太关心我的消息队列的速度,我首先需要可靠性和耐用性以及formost.为了安全起见,我希望有两个队列服务器,两个都在不同的数据中心,以防出现问题,一个是另一个的备份.

看看Celery看起来它支持一堆不同的后端,有些后端具有更多功能.两个最流行的看起来像redis和RabbitMQ所以我花了一些时间来进一步检查它们.

RabbitMQ: 支持持久队列和群集,但是它们今天进行群集的方式的问题是,如果丢失群集中的节点,则该节点中的所有消息都将不可用,直到您将该节点重新联机为止.它不会复制群集中不同节点之间的消息,只是复制有关消息的元数据,然后返回到原始节点以获取消息,如果节点未运行,则为SOL Not理想.

他们建议解决这个问题的方法是设置第二台服务器并使用DRBD复制文件系统,然后运行pacemaker之类的东西,以便在需要时将客户端切换到备份服务器.这似乎很复杂,不确定是否有更好的方法.谁知道更好的方法？

Redis: 支持一个读取从站,这将允许我在紧急情况下备份,但它不支持主 - 主设置,我不确定它是否处理主站和从站之间的主动故障转移.它没有RabbitMQ那样的功能,但看起来更容易设置和维护.

问题:

设置芹菜的最佳方法是什么,以保证消息处理.
有没有人这样做过？如果是这样,会分享您的所作所为吗？

high-availability message-queue rabbitmq redis celery

Ken*_*ane

lucky-day

34
推荐指数

2
解决办法

5444
查看次数

Scala + Akka:如何开发多机高可用性集群

我们正在Scala + Akka开发一个服务器系统,用于为Android,iPhone和Second Life的客户提供服务.此服务器的某些部分需要高度可用,在多台计算机上运行.如果其中一台服务器死亡(例如硬件故障),系统需要继续运行.我想我希望客户有一个他们将尝试连接的机器列表,类似于Cassandra的工作方式.

到目前为止,与阿卡我见过的多节点例子似乎对身边的可扩展性的理念为中心,而不是高可用性(至少在硬件方面).多节点示例似乎始终存在单点故障.比如有负载均衡,但如果我需要重新启动具有负载均衡的机器之一,我的系统会遭受一些停机时间.

是否有任何示例显示Akka的这种类型的硬件容错？或者,您是否有任何关于实现这一目标的好方法的想法？

到目前为止,我能够提出的最佳答案是研究Erlang OTP文档,冥想它们,并试图找出如何使用Akka中提供的构建块将我的系统放在一起.

但是,如果有关于如何在多台机器之间共享状态的资源,示例或想法,如果其中一台机器停机运行,我肯定会欣赏它们,因为我担心我可能会重新发明这里的轮子.也许有一个多节点STM容器可以自动保持多个节点之间的共享状态同步？或者这可能很容易使文档没有显示如何做到的例子,或者我在研究和实验中还不够彻底.任何想法或想法将不胜感激.

scala fault-tolerance high-availability akka

Uno*_*oti

2010 09-12

26
推荐指数

1
解决办法

8071
查看次数