标签: pacemaker

NFS v4、HA 迁移和客户端上的陈旧句柄

我正在使用 Pacemaker/OpenAIS 管理运行 NFS v4 的服务器。NFS 配置为使用 TCP。当我将 NFS 服务器迁移到 Pacemaker 集群中的另一个节点时,即使元数据被保留,来自客户端的连接也会“挂起”并最终在 90 秒后超时。90 秒后,旧的挂载点变为“陈旧”,无法再访问挂载的文件。

90 秒宽限期似乎是服务器配置的一部分,而不是客户端配置。我在服务器上看到此消息:

内核:NFSD:开始 90 秒宽限期

如果我在迁移(卸载然后重新安装共享)后重新启动客户端节点上的 NFS 客户端,则不会遇到该问题,但连接和文件传输仍然中断。

三个问题:

  1. 什么是 90 秒宽限期?它有什么用?
  2. 将 NFS 服务器迁移到另一个节点后,如何在不重新启动客户端的情况下防止文件在客户端上过时?
  3. 实际上是否可以在不丢失大文件上传的情况下迁移 NFS 服务器?

nfs migration high-availability pacemaker

3
推荐指数
1
解决办法
1万
查看次数

使起搏器重试失败的资源

我想让起搏器重新尝试启动我的资源

primitive Imq ocf:example:imq \
   op monitor on-fail="restart" interval="10s" \
   op start interval="0" timeout="60s" on-fail="restart" \
   meta failure-timeout="30s"
Run Code Online (Sandbox Code Playgroud)

请注意,此资源通过以下方式固定到第一个节点

location location_Imq Imq inf: vm1
location location_Imq1 Imq -inf: vm2
Run Code Online (Sandbox Code Playgroud)

目前,如果我破坏了阻止此资源启动失败计数的内容,则返回 INFINITY 并停止尝试重新启动服务。

我希望永远不会放弃资源,以便一旦间歇性问题自行清除,资源将重新启动并恢复服务。

在 CentOS 上使用起搏器 1.0。

linux pacemaker linux-ha

3
推荐指数
1
解决办法
9019
查看次数

是否可以使用配置文件配置起搏器?

我正在尝试使用配置文件配置起搏器(我可以自动生成然后要求起搏器“重新加载”)。但是我看到的所有示例都是针对命令行命令或交互式编辑器的。(我正在运行 Ubuntu)。

命令行方法是这样的

crm configure primitive VIP ocf:IPaddr2 params ip=10.0.2.200 nic=eth0 op monitor interval=10s
Run Code Online (Sandbox Code Playgroud)

虽然交互模式是这样的

sudo crm configure
And then we add the res_ip resource:

crm(live)configure# primitive res_ip ocf:heartbeat:IPaddr2 params ip="102.169.122.254" cidr_netmask="24" nic="eth0"
crm(live)configure# commit
crm(live)configure# exit
Run Code Online (Sandbox Code Playgroud)

但我想要一个可以更新和重新加载的静态配置文件。类似于/etc/ha.d/haresources心跳使用的文件。有这种可能吗?

pacemaker corosync

3
推荐指数
1
解决办法
1万
查看次数

在 CentOS 7 上使用 Pacemaker 进行 DRBDManage

我有2层CentOS 7.6我已与配置的节点drbddrbdmanagepacemaker主动/被动故障转移。

在故障期间,我的 vip 和drbd服务从主节点故障转移到下一个节点的辅助节点,但我无法连接drbdmanage到检查/管理集群。

由于pacemaker具有 drbdmanage 的资源类型,我假设我应该能够管理服务并将其故障转移到幸存的节点。

我想知道drbdmanage节点故障后是否可以进行故障转移?

drbd pacemaker failovercluster centos7

3
推荐指数
1
解决办法
364
查看次数

Hyper-V 上的起搏器和 DRBD

我需要为 Apache 网站设置两节点 Web 集群。我有 Hyper-V 基础设施,只有两个节点。重点是负载平衡和高可用性。

我安装并配置了两个带有 CentOS 7、Pacemaker 集群、MariaDB 10 的虚拟机。我在 Pacemaker 中配置了主/从 ocf::percona:mysql 资源。

接下来我需要一个用于网站内容的共享存储。我在双主模式下创建了 DRBD 磁盘,并在其顶部创建了 GFS2。我在没有添加到 Pacemaker 的情况下对其进行了测试。一切正常,但为了使其自动升级,我需要通过 Pacemaker 管理这些。

问题是 Pacemaker 需要围栏来创建 DRBD 资源,但没有用于 Hyper-V 的 stonith 代理。我读到在 CentOS 6 的先前版本中可以创建 SSH stonith 代理。我尝试这样做,但 pcs 无法使用它。

现在可以在 Hyper-V 之上使用 Pacemaker 吗?或者可能存在另一种在双主中使用 DRBD 的方法?

cluster hyper-v drbd pacemaker

2
推荐指数
1
解决办法
991
查看次数

如何在 RHEL 7 上的 NFS exportfs 集群资源中指定两个不同的子网

我正在 RHEL 7 集群上配置 NFS 导出资源,我需要让共享目录可以从属于不同子网的客户端安装。

例如,以下命令显然可以正常工作(仅定义了一个网络):

pcs resource create TEST-EXPORTFS ocf:heartbeat:exportfs clientspec=192.168.1.0/24 options=rw,sync,no_root_squash directory=/test fsid=1
Run Code Online (Sandbox Code Playgroud)

但是如何在“clientspec”参数中添加第二个网络(例如:192.168.100.0/24)以便来自两个子网的客户端可以挂载共享目录?

我在官方文档中找不到任何帮助(既不是来自 RedHat 也不是来自 Linux-HA)。

在此先感谢您提供的任何宝贵帮助。

cluster redhat nfs pacemaker

2
推荐指数
1
解决办法
4259
查看次数

编辑 HA 集群配置 cib.xml

我想编辑我在 centos 6.5 上的集群配置的 pingd,因为地址不再有效,而且我的集群总是因为节点失败而切换到另一个节点。最好的方法是什么。我知道我绝不能打开直接在cib.xml 文件中。

[root@PBX1 mojo]# pcs config
Cluster Name: pbx
Corosync Nodes:
 pbx1 pbx2
Pacemaker Nodes:
 pbx1 pbx2

Resources:
 Master: master_drbd
  Meta Attrs: master-max=1 master-node-max=1 clone-max=2 clone-node-max=1 notify=true
  Resource: drbd_drbd0 (class=ocf provider=linbit type=drbd)
   Attributes: drbd_resource=drbd0
   Operations: monitor interval=10s (drbd_drbd0-monitor-interval-10s)
 Clone: Connectivity
  Resource: p_ping (class=ocf provider=pacemaker type=ping)
   Attributes: host_list="10.66.4.4 10.66.4.5 10.66.4.11 10.66.4.252 10.66.4.253 10.66.4.254" multiplier=1000 dampen=5s
   Operations: monitor interval=1s (p_ping-monitor-interval-1s)
 Group: PBX_IP
  Resource: ClusPBXIP (class=ocf provider=heartbeat type=IPaddr2)
   Attributes: ip=10.66.6.200 nic=bond0.2 cidr_netmask=24
   Operations: monitor interval=30s (ClusPBXIP-monitor-interval-30s)
  Resource: ClusNetIP (class=ocf …
Run Code Online (Sandbox Code Playgroud)

linux pacemaker failovercluster corosync

2
推荐指数
1
解决办法
5529
查看次数

起搏器的保养和待机有什么区别

在起搏器中有一个待机模式。据我了解,它会导致活动服务从该节点迁移出来,以便对其进行维护。但是,还有一个维护模式或标志,我似乎找不到任何合理的文档。这引出了我的问题:任何人都可以启发我了解起搏器中待机和维护之间的区别。也许甚至他们的确切属性是什么。

pacemaker

2
推荐指数
1
解决办法
7040
查看次数

如何在我的 LAN 中测试负载平衡?

我最近发布了一个关于在预算上平衡网络服务器问题的问题。这是最后的时间开始测试,所以我认为有关设置两个或两个以上的Ubuntu虚拟机在我的局域网上运行pacemaker+ corosync,以学习的基础知识,并尝试不同的CONFIGS出来。

安装corosync+后如何开始,pacemaker因为我的 LAN 中的每个 VM 都没有附加公共 IP?

ubuntu cluster load-balancing pacemaker corosync

1
推荐指数
1
解决办法
410
查看次数