gpt4 book ai didi

docker - 从swarm中删除终止的实例(管理器),并恢复swarm状态

转载 作者:行者123 更新时间:2023-12-02 19:49:20 25 4
gpt4 key购买 nike

我有一个docker swarm集群,在6个AWS实例上运行的主机,在某些测试中,我们意外终止了3个实例(正在运行的主机)。现在,群集状态似乎无法正常工作,产生如下错误:

Error: rpc error: code = Unknown desc = The swarm does not have a leader. It's possible that too few managers are online. Make sure more than half of the managers are online



我尝试通过docker命令删除终止的管理器,但是我喜欢 docker node ls 或其他命令的任何命令都会给我与上述相同的错误。我还尝试添加新节点,而在添加到群集时会生成相同的错误。

当我在其中一个管理器中发布docker info但却无法执行任何操作时,我可以看到所有终止的实例IP。我如何从这种状态中恢复?
 Node Address: 10.80.8.195
Manager Addresses:
10.80.7.104:2377
10.80.7.213:2377
10.80.7.226:2377
10.80.7.91:2377
10.80.8.195:2377
10.80.8.219:2377

最佳答案

群内的集群功能由管理器节点维护。
在您的情况下,您通过删除一半的集群管理器而丢失了集群仲裁。在这种特殊情况下,没有节点可以选举新的管理者领导者,也没有管理者可以控制群体。

在这种情况下,恢复群集的唯一方法是重新初始化它,这将强制创建新群集。

在管理器节点上,运行以下命令:

docker swarm init --force-new-cluster

在其他管理器节点上,我不记得他们是否加入了新集群,或者是否需要离开并再次加入集群。

关于docker - 从swarm中删除终止的实例(管理器),并恢复swarm状态,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61897848/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com