Nag*_*gri 6 redis redis-cluster
我正在尝试使用 6 台机器实现 Redis 集群。我有一个由六台机器组成的流浪集群:
192.168.56.101
192.168.56.102
192.168.56.103
192.168.56.104
192.168.56.105
192.168.56.106
Run Code Online (Sandbox Code Playgroud)
所有正在运行的 redis-server
我编辑了以上所有服务器的 /etc/redis/redis.conf 文件添加了这个
cluster-enabled yes
cluster-config-file nodes.conf
cluster-node-timeout 5000
cluster-slave-validity-factor 0
appendonly yes
Run Code Online (Sandbox Code Playgroud)
然后我在六台机器中的一台上运行它;
./redis-trib.rb create --replicas 1 192.168.56.101:6379 192.168.56.102:6379 192.168.56.103:6379 192.168.56.104:6379 192.168.56.105:6379 192.168.56.106:6379
Run Code Online (Sandbox Code Playgroud)
Redis 集群已启动并正在运行。我通过在一台机器上设置值来手动检查它在另一台机器上显示。
$ redis-cli -p 6379 cluster nodes
3c6ffdddfec4e726f29d06a6da550f94d976f859 192.168.56.105:6379 master - 0 1450088598212 5 connected
47d04bc98ab42fc793f9f382855e5c54ab8f2e20 192.168.56.102:6379 slave caf2cec45114dc8f4cbc6d96c6dbb20b62a39f90 0 1450088598716 7 connected
040d4bb6a00569fc44eec05440a5fe0796952ccf 192.168.56.101:6379 myself,slave 5318e48e9ef0fc68d2dc723a336b791fc43e23c8 0 0 4 connected
caf2cec45114dc8f4cbc6d96c6dbb20b62a39f90 192.168.56.104:6379 master - 0 1450088599720 7 connected 0-10922
d78293d0821de3ab3d2bca82b24525e976e7ab63 192.168.56.106:6379 slave 5318e48e9ef0fc68d2dc723a336b791fc43e23c8 0 1450088599316 8 connected
5318e48e9ef0fc68d2dc723a336b791fc43e23c8 192.168.56.103:6379 master - 0 1450088599218 8 connected 10923-16383
Run Code Online (Sandbox Code Playgroud)
我的问题是,当我在任何一台机器上关闭或停止 redis-server 时master,整个集群都出现了故障,但是如果三个从站都死了,集群仍然可以正常工作。
如果主站故障(容错),我该怎么做才能让从站变成主站?
我假设 redis 处理所有这些事情,部署集群后我不必担心它。我是对的还是我必须自己做?
另一个问题是假设我有六台 16GB 内存的机器。在这个具有三个主站和三个从站的 Redis 集群上,我能够处理多少总数据?
谢谢你。
小智 -2
这里的设置cluster-slave-validity-factor 0可能是罪魁祸首。
# A slave of a failing master will avoid to start a failover if its data
# looks too old.
Run Code Online (Sandbox Code Playgroud)
在您的设置中,已终止主服务器的从服务器认为自己不适合当选主服务器,因为它上次联系主服务器的时间大于以下计算值:
(node-timeout * slave-validity-factor) + repl-ping-slave-period
因此,即使有冗余从站,集群状态也会更改为 DOWN 并且变得不可用。
您可以尝试使用不同的值,例如建议的默认值
cluster-slave-validity-factor 10
这将确保集群能够容忍一个随机的 Redis 实例故障。(它可以是从属实例或主实例)
对于第二个问题:六台 16GB RAM 的机器将能够充当包含 3 个主实例和 3 个从实例的 Redis 集群。因此理论上最大数据量为 16GB x 3。cluster-require-full-coverage如果打开,这样的集群最多可以容忍一个节点故障。否则,它可能仍然能够在运行实例中仍然可用的分片中提供数据。
| 归档时间: |
|
| 查看次数: |
3421 次 |
| 最近记录: |