gpt4 book ai didi

linux - 当 mesos master 和 agent 同时宕机时,mesos 集群是否无法访问?

转载 作者:太空宇宙 更新时间:2023-11-04 12:32:30 25 4
gpt4 key购买 nike

我正在尝试通过三台机器实现 HA,并拥有如下所示的主设备和从设备。我正在使用 VM 进行本地测试设置,我的观察结果如下。

案例一:

m1 -> 领袖大师

m2 -> 非leader master, slave1

m3 -> 非leader master, slave2

  • 案例 1.1:当我关闭 VM m1 机器时,其中一个非领导者变为领导能够接入集群,正常工作。

  • 案例 1.2:我关闭 m2 或 m3(任何一个非主从虚拟机)。我在 m3 或 m2 的网页上看到消息“当前没有主控”。当我尝试访问 m1 和任何一台可用机器(m2 或 m3)中的 mesos 时。

案例2:

m1->非领导者

m2->leader,slave1,

m3->非领导者,slave2

  • Case2.1:当我关闭VM m1 机器时,m2 中的leader 将保持并且集群正常工作。

  • 案例 2.2:当我关闭 m2(leader 和 slave)时,集群变得不可用,并在网页上显示错误消息“No Master is currently leading”。

  • 案例 2.3:当我关闭 m3(带从属的非领导者)时,集群变得不可用,并在网页上显示错误消息“No Master is currently leading”。

很抱歉只用 3 台机器尝试 HA 和冗长的问题解释。

问题:

  • 同时拥有master(leading/non-leading)和slave的kill machine总是会导致集群不可用? (案例1.2、2.2、2.3)

  • 我们可以像上面那样用三台机器实现 HA,即在同一台机器上有 3 个主机和 2 个从机吗?

    配置如下。

大师:

m1 : mesos-master --ip=192.168.1.36 --hostname=192.168.1.36 --port=6060 --quorum=2 --cluster=mesosCluster --zk=zk://192.168.1.36:2181,192.168.1.42:2181,192.168.1.45:2181/mesos --work_dir=/opt/ncms/mesosWorkDir/ --log_dir=/opt/ncms/mesosWorkDir/logs

m2 : mesos-master --ip=192.168.1.42 --hostname=192.168.1.42 --port=6060 --quorum=2 --cluster=mesosCluster --zk=zk://192.168.1.36:2181,192.168.1.42:2181,192.168.1.45:2181/mesos --work_dir=/opt/ncms/mesosWorkDir/ --log_dir=/opt/ncms/mesosWorkDir/logs

m3 : mesos-master --ip=192.168.1.45 --hostname=192.168.1.45 --port=6060 --quorum=2 --cluster=mesosCluster --zk=zk://192.168.1.36:2181,192.168.1.42:2181,192.168.1.45:2181/mesos --work_dir=/opt/ncms/mesosWorkDir/ --log_dir=/opt/ncms/mesosWorkDir/logs

奴隶:

m2 : mesos-slave --ip=192.168.1.42 --hostname=192.168.1.42 --executor_registration_timeout=10mins --systemd_enable_support=false --master=zk://192.168.1.42:2181,192.168.1.45:2181,192.168.1.36:2181/mesos --containerizers=mesos,docker

m3 : mesos-slave --ip=192.168.1.45 --hostname=192.168.1.45 --executor_registration_timeout=10mins --systemd_enable_support=false --master=zk://192.168.1.42:2181,192.168.1.45:2181,192.168.1.36:2181/mesos --containerizers=mesos,docker

动物园管理员配置:

滴答时间=2000

初始限制=10

同步限制=5

dataDir=/opt/ncms/zkWorkDir

客户端端口=2181

server.1=192.168.1.42:2888:3888server.3=192.168.1.36:2888:3888

server.5=192.168.1.45:2888:3888

设置:

Host: Windows 7 (64GB RAM, 24 Cores )

Virtual Box : each vm(m1, m2, m3) has 2 cores and 2 GB RAM with RHEL 7.2

最佳答案

在您描述的场景中,事件主控的数量低于 quorum ,在您的情况下为 2。这被认为是一种异常(exception)情况,某些操作不会成功,例如,任何操作 modifying the distributed registry .

关于linux - 当 mesos master 和 agent 同时宕机时,mesos 集群是否无法访问?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42923412/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com