gpt4 book ai didi

linux - 当数据库安装在无响应的文件系统上时,服务 postgresql 停止挂起 - 导致 ha 故障转移挂起

转载 作者:塔克拉玛干 更新时间:2023-11-03 01:09:06 25 4
gpt4 key购买 nike

我有一个 HA 集群(一个冗余对)设置运行一个 postgresql 数据库——数据库在一个 NFS 文件管理器上。如果与文件管理器的连接从主服务器断开(例如电缆掉线)——那么主服务器会尝试进行故障转移。然而,故障转移在运行“service postgres stop”时挂起,因为 nfs 挂载没有响应。

我的 google-fu 让我失望了(尽管我原以为其他人以前会打这个!)

我的 ha.cf 文件:

logfile /var/log/ha-log
logfacility local0
keepalive 2
warntime 15
deadtime 30
initdead 60
ucast eth0 <eth0 ip>
ucast eth1 <eth1 ip>
node node2
node node1
auto_failback off
respawn hacluster /usr/lib/heartbeat/ipfail
apiauth ipfail uid=hacluster
ping <filer IP>

资源:

node2 IPaddr::<VIP>/24/eth0 Filesystem::<filer export>::/var/lib/pgsql::nfs::rw,noatime,rsize=4096,wsize=4096,hard,intr,noac,nfsvers=3 postgresql

最佳答案

当服务器消失时,NFS 挂载可能会挂起很长一段时间,最多十分钟。

这种滞后可能会导致很难正确隔离两台服务器。如果 NFS 服务器在故障主机上的 postgres 进程死亡之前恢复正常,则故障主机的 postgres 进程和新的主机 postgres 进程可能会尝试同时写入数据库文件,从而导致损坏。

关于linux - 当数据库安装在无响应的文件系统上时,服务 postgresql 停止挂起 - 导致 ha 故障转移挂起,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9164533/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com