如何设置自动扩展RabbitMQ群集AWS

Kar*_*hik 8 cluster-computing amazon-ec2 rabbitmq amazon-web-services docker

我正试图从SQS转移到RabbitMQ以获取消息服务.我正在寻求建立一个稳定的高可用性排队服务.现在我要去集群了.

当前实现,我有三台带有RabbitMQ的EC2机器,管理插件安装在AMI中,然后我明确地去了每台机器并添加

sudo rabbitmqctl join_cluster rabbit@<hostnameOfParentMachine>
Run Code Online (Sandbox Code Playgroud)

将HA属性设置为all并且同步有效.并且负载均衡器位于顶部,并分配了DNS.到目前为止这件事情有效.

预期实施:创建自动扩展群集环境,其中上/下的计算机必须动态加入/删除群集.实现这一目标的最佳方法是什么?请帮忙.

Gab*_*ele 12

两年前我有类似的配置.

我决定使用amazon VPC,默认情况下我的设计总是运行两个RabbitMQ实例,并在集群中配置(称为主节点).rabbitmq集群位于内部亚马逊负载均衡器后面.

我创建了一个配置了RabbitMQ和管理插件的AMI(称为"master-AMI"),然后我配置了自动缩放规则.

如果引发自动调节警报,则启动新的主AMI.此AMI在第一次执行时执行以下脚本:

#!/usr/bin/env python
import json
import urllib2,base64

if __name__ == '__main__':
    prefix =''
    from subprocess import call
    call(["rabbitmqctl", "stop_app"])
    call(["rabbitmqctl", "reset"])
    try:
        _url = 'http://internal-myloadbalamcer-xxx.com:15672/api/nodes'
        print prefix + 'Get json info from ..' + _url
        request = urllib2.Request(_url)

        base64string = base64.encodestring('%s:%s' % ('guest', 'guest')).replace('\n', '')
        request.add_header("Authorization", "Basic %s" % base64string)
        data = json.load(urllib2.urlopen(request))
        ##if the script got an error here you can assume that it's the first machine and then 
        ## exit without controll the error. Remember to add the new machine to the balancer
        print prefix + 'request ok... finding for running node'


        for r in data:
            if r.get('running'):
                print prefix + 'found running node to bind..'
                print prefix + 'node name: '+ r.get('name') +'- running:' + str(r.get('running'))
                from subprocess import call
                call(["rabbitmqctl", "join_cluster",r.get('name')])
                break;
        pass
    except Exception, e:
        print prefix + 'error during add node'
    finally:
        from subprocess import call
        call(["rabbitmqctl", "start_app"])


    pass
Run Code Online (Sandbox Code Playgroud)

脚本使用HTTP API" http://internal-myloadbalamcer-xxx.com:15672/api/nodes "查找节点,然后选择一个并将新AMI绑定到群集.

作为HA政策,我决定使用它:

rabbitmqctl set_policy ha-two "^two\." ^
   "{""ha-mode"":""exactly"",""ha-params"":2,"ha-sync-mode":"automatic"}"
Run Code Online (Sandbox Code Playgroud)

好吧,连接"相当"容易,问题决定了何时可以从群集中删除节点.

您无法根据自动缩放规则删除节点,因为您可以向必须使用的队列发送消息.

我决定执行一个定期运行到两个主节点实例的脚本:

  • 通过API http:// node:15672/api/queues检查消息计数
  • 如果所有队列的消息计数为零,我可以从负载均衡器中删除该实例,然后从rabbitmq集群中删除该实例.

这就是我所做的,希望它有所帮助.

[编辑]

我编辑了答案,因为有这个插件可以帮助:

我建议看到这个:https://github.com/rabbitmq/rabbitmq-autocluster

该插件已移至官方RabbitMQ存储库,可以轻松解决此类问题

  • 不是集群的重点,你可以_can_删除节点,因为数据是在节点之间复制的吗? (3认同)