标签: high-availability

高可用性存储

我想通过NFS和CIFS提供2 TB左右.我正在寻找一个2(或更多)服务器解决方案,以实现高可用性,并尽可能在服务器之间实现负载平衡.有关群集或高可用性解决方案的任何建议吗？

这是商业用途,计划在未来几年内增长到5-10 TB.我们的设施几乎每天24小时,每周六天.我们可能有15-30分钟的停机时间,但我们希望尽量减少数据丢失.我想尽量减少凌晨3点的电话.

我们目前在Solaris上运行一台带有ZFS的服务器,我们正在考虑用于HA部分的AVS,但是我们在Solaris上遇到了一些小问题(CIFS实现不能与Vista一起使用等).

我们已经开始关注了

GFS上的DRDB(GFS用于分布式锁定功能)
Gluster(需要客户端部分,没有本地CIFS支持吗？)
Windows DFS(doc说文件关闭后只复制？)

我们正在寻找一个提供数据的"黑匣子".

我们目前在ZFS中对数据进行快照,并通过网络将快照发送到远程数据中心进行异地备份.

我们最初的计划是每10到15分钟就有一台第二台机器和rsync.失败的问题在于,正在进行的生产过程将丢失15分钟的数据并留在"中间".从一开始,它们几乎更容易开始,而不是找出中间拾取的位置.这就是驱使我们看待HA解决方案的原因.

storage high-availability

pet*_*tey

2008 09-18

4
推荐指数

1
解决办法

3821
查看次数

当 Yarn 中的资源管理器 (RM) 出现故障时会发生什么？

在运行作业的过程中，如果资源管理器宕机，那么作业会发生什么？

作业是自动提交还是我们需要再次提交作业？

谢谢，

文卡特

hadoop high-availability hadoop-yarn hadoop2

Ven*_*kat

2016 01-28

4
推荐指数

1
解决办法

5306
查看次数

AMQP/RabbitMQ - 按顺序处理消息

我有一个直接交换。还有一个队列，绑定到这个交换。

我有两个消费者用于该队列。一旦完成相应的处理，消费者就会手动确认消息。

消息按逻辑排序/排序，并应按该顺序处理。是否可以强制所有消息在消费者 A 和消费者 B 之间按顺序接收和处理？换句话说，防止 A 和 B 同时处理消息。

注意：消费者不共享相同的连接和/或通道。这意味着我不能使用<channel>.basicQoS(1);.

这个问题的基本原理：两个消费者都是相同的。如果一个队列出现故障，另一个队列开始处理消息，一切都将继续工作，无需任何干预。

high-availability amqp rabbitmq

Kan*_*iet

2016 06-05

4
推荐指数

3
解决办法

4948
查看次数

RabbitMQ 如何决定何时删除消息？

我想了解RabbitMQ中消息删除的逻辑。

我的目标是即使没有连接到读取它们的客户端也使消息持久化，以便当客户端重新连接时消息正在等待它们。我可以使用持久的惰性队列，以便将消息持久化到磁盘，并且我可以使用 HA 复制来确保多个节点获得所有排队消息的副本。

我希望使用主题或标头路由将消息发送到两个或多个队列，并让一个或多个客户端读取每个队列。

我有两个队列，A 和 B，由标头交换提供。队列 A 获取所有消息。队列 B 仅获取带有“归档”标头的消息。队列 A 有 3 个消费者正在阅读。队列 B 有 1 个消费者。如果 B 的消费者死了，但是 A 的消费者继续确认消息，RabbitMQ 会删除这些消息还是继续存储它们？在重新启动 B 之前，队列 B 不会有任何人使用它，我希望消息保持可用以供以后使用。

到目前为止，我已经阅读了大量文档，但仍然没有找到明确的答案。

high-availability queueing rabbitmq

Mne*_*quo

lucky-day

4
推荐指数

2
解决办法

6213
查看次数

mysql - 我可以查询给定主机给出了多少个 connect_errors 吗？

MySQL 有一项策略，一旦主机达到可配置的登录尝试失败次数，就会拒绝主机重新连接。

这可以使用进行设置@@global.max_connect_errors。请参阅此处： https ://dev.mysql.com/doc/refman/5.7/en/blocked-host.html

我找不到，如果有人能给我指路，那就太好了 - 询问数据库数据库从给定主机经历了多少次失败的连接尝试。

我正在几个节点之间进行高可用性设置，找到这一点对我来说很重要 - 特别是在我们的测试和集成环境中。

有人吗？

mysql high-availability login-control

Rad*_*own

lucky-day

4
推荐指数

1
解决办法

5323
查看次数

HA 集群 ActiveMQ Artemis 的正确配置

我是 ActiveMQ Artemis 的新手，请社区检查我在代理 HA 集群的配置中是否正确，或者我可能应该以其他方式配置它们，因为我还没有找到关于我的案例的详细教程。所有代理都在同一台机器上运行。

场景：

端口上有一个主节点，端口和61617上有两个从节点（slave1、slave2）。如果主节点死亡，其中一个从节点将变为活动状态（复制模式）。6161861619

消费者有必要像“黑匣子”一样与集群进行通信。我的意思是，主服务器的更改（即主服务器死亡时）不应该对消费者（即它连接到集群的方式）产生任何影响。

我设法做了什么（据我所知，在这种情况下，我们应该只配置集群、接受器和连接器属性，因此我只附加代理配置的这一部分）：

主经纪人：

<connectors>
    <connector name="artemis">tcp://localhost:61617</connector> 
</connectors>

<ha-policy>
    <replication>
        <master/>
    </replication>   
</ha-policy>

<acceptors>
    <acceptor name="artemis">tcp://localhost:61617</acceptor>
</acceptors>

<cluster-user>cluster</cluster-user>
<cluster-password>cluster</cluster-password>
<broadcast-groups>
    <broadcast-group name="bg-group1">
        <group-address>231.7.7.7</group-address>
        <group-port>9876</group-port>
        <broadcast-period>5000</broadcast-period>
        <connector-ref>artemis</connector-ref>
    </broadcast-group>
</broadcast-groups>
<discovery-groups>
    <discovery-group name="dg-group1">
        <group-address>231.7.7.7</group-address>
        <group-port>9876</group-port>
        <refresh-timeout>10000</refresh-timeout>
    </discovery-group>
</discovery-groups>
<cluster-connections>
    <cluster-connection name="my-cluster">
        <connector-ref>artemis</connector-ref>
        <message-load-balancing>ON_DEMAND</message-load-balancing>
        <max-hops>0</max-hops>
        <discovery-group-ref discovery-group-name="dg-group1"/>
    </cluster-connection>
</cluster-connections>

Run Code Online (Sandbox Code Playgroud)

Slave 1 Broker集群conf与master相同（通过控制台创建节点时自动配置--clustered）

<ha-policy>
    <replication>
        <slave/>
    </replication>
</ha-policy>

<connectors>
    <connector name="artemis">tcp://localhost:61618</connector>
    <connector name="netty-live-connector">tcp://localhost:61617</connector>
</connectors>

<acceptors>
    <acceptor name="artemis">tcp://localhost:61618 </acceptor>
</acceptors>

Run Code Online (Sandbox Code Playgroud)

Slave 2 …

high-availability activemq-artemis

Lil*_*lia

2019 10-29

4
推荐指数

1
解决办法

7752
查看次数

如何检查 apache 和 php-fpm 配置是否合适（不要太高或太低）

我将在一个应用程序（php 基础）上举办一个有 3000 名用户的活动。

我在云中启动了多个实例并在其上安装了 LAMP。[进行负载测试并选择事件]

在 Ubuntu 18 上

我启用了 mpm_event 和 php7.4-fpm（这似乎是 apache 和 php 应用程序高流量的更好配置）。

我用这篇文章解释了如何调整你的配置。像这样：

这里是 apache2 mpm 事件conf：

<IfModule mpm_*_module>
  ServerLimit           (Total RAM - Memory used for Linux, DB, etc.) / process size
  StartServers          (Number of Cores)
  MinSpareThreads       25
  MaxSpareThreads       75
  ThreadLimit           64
  ThreadsPerChild       25
  MaxRequestWorkers     (Total RAM - Memory used for Linux, DB, etc.) / process size
  MaxConnectionsPerChild   1000
</IfModule>

Run Code Online (Sandbox Code Playgroud)

这里是 php7.4-fpm ：

pm = dynamic            
pm.max_children …

Run Code Online (Sandbox Code Playgroud)

php apache performance high-availability

Lex*_*aGC

lucky-day

4
推荐指数

1
解决办法

9195
查看次数

是 Azure Traffic Manager 还是 Azure front Door in front 用于多区域系统架构？

我们在 2 个不同地理区域（日本东部和西部）的 Azure 服务结构集群上托管 Web API 应用程序及其相关支持后台服务，以应对 Azure 区域中断。它们是主动-被动高可用性集群。

预期传入流量仅为 HTTPS。

我们的应用程序的流量仅来自特定国家（日本），而不是来自世界各地。

将流量管理器或 Azure 前门放在这些多区域设置的前面更好吗？停电期间哪一种故障转移速度快？什么时候选择哪一个？优点缺点？

浏览了文件，上述问题没有具体答案。

high-availability azure azure-traffic-manager azure-service-fabric azure-front-door

ecm*_*402

2021 04-09

4
推荐指数

1
解决办法

1万
查看次数

rabbitmq HA集群

我想将RabbitMQ设置为具有HA的两个(或更多)节点集群.

使用案例:客户端生产者应用程序(C#.NET)知道群集有两个节点并发布到群集.各种消费者应用程序(也称为C#.NET)连接到群集并获取生产者生成的所有消息.只要至少有一个节点启动并运行生产者,消费者就会继续工作而不会出错.假设节点A和B正在运行而B死了一段时间,然后重新启动,然后一段时间A死亡,客户端都继续运行而没有收到错误,因为在任何时候至少有一个节点启动.

是否可以开箱即用？

对于Windows/.NET应用程序环境,是否有更适合(商业上可行)的其他MQ？

high-availability rabbitmq

fre*_*ith

lucky-day

3
推荐指数

2
解决办法

5349
查看次数