标签: high-availability

高可用性存储

我想通过NFS和CIFS提供2 TB左右.我正在寻找一个2(或更多)服务器解决方案,以实现高可用性,并尽可能在服务器之间实现负载平衡.有关群集或高可用性解决方案的任何建议吗?

这是商业用途,计划在未来几年内增长到5-10 TB.我们的设施几乎每天24小时,每周六天.我们可能有15-30分钟的停机时间,但我们希望尽量减少数据丢失.我想尽量减少凌晨3点的电话.

我们目前在Solaris上运行一台带有ZFS的服务器,我们正在考虑用于HA部分的AVS,但是我们在Solaris上遇到了一些小问题(CIFS实现不能与Vista一起使用等).

我们已经开始关注了

  • GFS上的DRDB(GFS用于分布式锁定功能)
  • Gluster(需要客户端部分,没有本地CIFS支持吗?)
  • Windows DFS(doc说文件关闭后只复制?)

我们正在寻找一个提供数据的"黑匣子".

我们目前在ZFS中对数据进行快照,并通过网络将快照发送到远程数据中心进行异地备份.

我们最初的计划是每10到15分钟就有一台第二台机器和rsync.失败的问题在于,正在进行的生产过程将丢失15分钟的数据并留在"中间".从一开始,它们几乎更容易开始,而不是找出中间拾取的位置.这就是驱使我们看待HA解决方案的原因.

storage high-availability

4
推荐指数
1
解决办法
3821
查看次数

当 Yarn 中的资源管理器 (RM) 出现故障时会发生什么?

当 Yarn 中的资源管理器 (RM) 出现故障时会发生什么?

在运行作业的过程中,如果资源管理器宕机,那么作业会发生什么?

作业是自动提交还是我们需要再次提交作业?

谢谢,

文卡特

hadoop high-availability hadoop-yarn hadoop2

4
推荐指数
1
解决办法
5306
查看次数

AMQP/RabbitMQ - 按顺序处理消息

我有一个直接交换。还有一个队列,绑定到这个交换。

我有两个消费者用于该队列。一旦完成相应的处理,消费者就会手动确认消息。

消息按逻辑排序/排序,并应按该顺序处理。是否可以强制所有消息在消费者 A 和消费者 B 之间按顺序接收和处理?换句话说,防止 A 和 B 同时处理消息。

注意:消费者共享相同的连接和/或通道。这意味着我不能使用<channel>.basicQoS(1);.

这个问题的基本原理:两个消费者都是相同的。如果一个队列出现故障,另一个队列开始处理消息,一切都将继续工作,无需任何干预。

high-availability amqp rabbitmq

4
推荐指数
3
解决办法
4948
查看次数

RabbitMQ 如何决定何时删除消息?

我想了解RabbitMQ中消息删除的逻辑。

我的目标是即使没有连接到读取它们的客户端也使消息持久化,以便当客户端重新连接时消息正在等待它们。我可以使用持久的惰性队列,以便将消息持久化到磁盘,并且我可以使用 HA 复制来确保多个节点获得所有排队消息的副本。

我希望使用主题或标头路由将消息发送到两个或多个队列,并让一个或多个客户端读取每个队列。

我有两个队列,A 和 B,由标头交换提供。队列 A 获取所有消息。队列 B 仅获取带有“归档”标头的消息。队列 A 有 3 个消费者正在阅读。队列 B 有 1 个消费者。如果 B 的消费者死了,但是 A 的消费者继续确认消息,RabbitMQ 会删除这些消息还是继续存储它们?在重新启动 B 之前,队列 B 不会有任何人使用它,我希望消息保持可用以供以后使用。

到目前为止,我已经阅读了大量文档,但仍然没有找到明确的答案。

high-availability queueing rabbitmq

4
推荐指数
2
解决办法
6213
查看次数

mysql - 我可以查询给定主机给出了多少个 connect_errors 吗?

MySQL 有一项策略,一旦主机达到可配置的登录尝试失败次数,就会拒绝主机重新连接。

这可以使用 进行设置@@global.max_connect_errors。请参阅此处: https ://dev.mysql.com/doc/refman/5.7/en/blocked-host.html

我找不到,如果有人能给我指路,那就太好了 - 询问数据库数据库从给定主机经历了多少次失败的连接尝试。

我正在几个节点之间进行高可用性设置,找到这一点对我来说很重要 - 特别是在我们的测试和集成环境中。

有人吗?

mysql high-availability login-control

4
推荐指数
1
解决办法
5323
查看次数

HA 集群 ActiveMQ Artemis 的正确配置

我是 ActiveMQ Artemis 的新手,请社区检查我在代理 HA 集群的配置中是否正确,或者我可能应该以其他方式配置它们,因为我还没有找到关于我的案例的详细教程。所有代理都在同一台机器上运行。

场景

端口上有一个主节点,端口和61617上有两个从节点(slave1、slave2)。如果主节点死亡,其中一个从节点将变为活动状态(复制模式)。6161861619

消费者有必要像“黑匣子”一样与集群进行通信。我的意思是,主服务器的更改(即主服务器死亡时)不应该对消费者(即它连接到集群的方式)产生任何影响。

我设法做了什么(据我所知,在这种情况下,我们应该只配置集群、接受器和连接器属性,因此我只附加代理配置的这一部分):

主经纪人:

<connectors>
    <connector name="artemis">tcp://localhost:61617</connector> 
</connectors>

<ha-policy>
    <replication>
        <master/>
    </replication>   
</ha-policy>

<acceptors>
    <acceptor name="artemis">tcp://localhost:61617</acceptor>
</acceptors>

<cluster-user>cluster</cluster-user>
<cluster-password>cluster</cluster-password>
<broadcast-groups>
    <broadcast-group name="bg-group1">
        <group-address>231.7.7.7</group-address>
        <group-port>9876</group-port>
        <broadcast-period>5000</broadcast-period>
        <connector-ref>artemis</connector-ref>
    </broadcast-group>
</broadcast-groups>
<discovery-groups>
    <discovery-group name="dg-group1">
        <group-address>231.7.7.7</group-address>
        <group-port>9876</group-port>
        <refresh-timeout>10000</refresh-timeout>
    </discovery-group>
</discovery-groups>
<cluster-connections>
    <cluster-connection name="my-cluster">
        <connector-ref>artemis</connector-ref>
        <message-load-balancing>ON_DEMAND</message-load-balancing>
        <max-hops>0</max-hops>
        <discovery-group-ref discovery-group-name="dg-group1"/>
    </cluster-connection>
</cluster-connections>
Run Code Online (Sandbox Code Playgroud)

Slave 1 Broker集群conf与master相同(通过控制台创建节点时自动配置--clustered)

<ha-policy>
    <replication>
        <slave/>
    </replication>
</ha-policy>

<connectors>
    <connector name="artemis">tcp://localhost:61618</connector>
    <connector name="netty-live-connector">tcp://localhost:61617</connector>
</connectors>

<acceptors>
    <acceptor name="artemis">tcp://localhost:61618 </acceptor>
</acceptors>
Run Code Online (Sandbox Code Playgroud)

Slave 2 …

high-availability activemq-artemis

4
推荐指数
1
解决办法
7752
查看次数

如何检查 apache 和 php-fpm 配置是否合适(不要太高或太低)

我将在一个应用程序(php 基础)上举办一个有 3000 名用户的活动。

我在云中启动了多个实例并在其上安装了 LAMP。[进行负载测试并选择事件]

在 Ubuntu 18 上

在此输入图像描述

我启用了 mpm_event 和 php7.4-fpm(这似乎是 apache 和 php 应用程序高流量的更好配置)。

我用这篇文章解释了如何调整你的配置。像这样 :

这里是 apache2 mpm 事件conf:

<IfModule mpm_*_module>
  ServerLimit           (Total RAM - Memory used for Linux, DB, etc.) / process size
  StartServers          (Number of Cores)
  MinSpareThreads       25
  MaxSpareThreads       75
  ThreadLimit           64
  ThreadsPerChild       25
  MaxRequestWorkers     (Total RAM - Memory used for Linux, DB, etc.) / process size
  MaxConnectionsPerChild   1000
</IfModule>
Run Code Online (Sandbox Code Playgroud)

这里是 php7.4-fpm :

pm = dynamic            
pm.max_children …
Run Code Online (Sandbox Code Playgroud)

php apache performance high-availability

4
推荐指数
1
解决办法
9195
查看次数

是 Azure Traffic Manager 还是 Azure front Door in front 用于多区域系统架构?

我们在 2 个不同地理区域(日本东部和西部)的 Azure 服务结构集群上托管 Web API 应用程序及其相关支持后台服务,以应对 Azure 区域中断。它们是主动-被动高可用性集群。

预期传入流量仅为 HTTPS。

我们的应用程序的流量仅来自特定国家(日本),而不是来自世界各地。

将流量管理器或 Azure 前门放在这些多区域设置的前面更好吗?停电期间哪一种故障转移速度快?什么时候选择哪一个?优点缺点?

浏览了文件,上述问题没有具体答案。

high-availability azure azure-traffic-manager azure-service-fabric azure-front-door

4
推荐指数
1
解决办法
1万
查看次数

rabbitmq HA集群

我想将RabbitMQ设置为具有HA的两个(或更多)节点集群.

使用案例:客户端生产者应用程序(C#.NET)知道群集有两个节点并发布到群集.各种消费者应用程序(也称为C#.NET)连接到群集并获取生产者生成的所有消息.只要至少有一个节点启动并运行生产者,消费者就会继续工作而不会出错.假设节点A和B正在运行而B死了一段时间,然后重新启动,然后一段时间A死亡,客户端都继续运行而没有收到错误,因为在任何时候至少有一个节点启动.

是否可以开箱即用?

对于Windows/.NET应用程序环境,是否有更适合(商业上可行)的其他MQ?

high-availability rabbitmq

3
推荐指数
2
解决办法
5349
查看次数

PostgreSQL是否支持DRBD的主动 - 主动群集?

我们在我们的应用程序中使用PostgreSQL 9.3.我们想用DRBD设置PostgreSQL主动 - 主动群集.我谷歌它,看到很多关于主动 - 被动的资源.

PostgreSQL是否支持DRBD的主动 - 主动群集?

postgresql high-availability

3
推荐指数
1
解决办法
8412
查看次数