amazon-ec2 - CoreOS、Fleet 和 Etcd2 容错-6ren

amazon-ec2 - CoreOS、Fleet 和 Etcd2 容错

转载作者：行者123 更新时间：2023-12-03 09:37:46

29

4

我有一个 23 节点集群，在 AWS 上跨 4 个可用区运行 CoreOS Stable 681.2.0。所有节点都在运行 etcd2 和 flannel。在 23 个节点中，8 个是专用的 etcd2 节点，其余的被专门指定为 etcd2 代理。

计划到集群的是 3 个 nginx plus 容器、一个私有(private) Docker 注册表、SkyDNS 和 4 个我们的应用程序容器。应用程序容器向 etcd2 注册自己，nginx 容器接收任何更改，渲染必要的文件，最后重新加载。

这一切都完美无缺，直到单个 etcd2 节点因任何原因不可用。

如果投票的 etcd2 成员集群失去了与其他一个投票的 etcd2 成员的连接，那么调度到队列的所有服务都会变得不稳定。计划的服务在没有我干预的情况下开始停止和启动。

作为测试，我开始停止托管投票 etcd2 节点的 EC2 实例，直到失去仲裁。第一个etcd2节点停止后，就开始出现上述症状。在第二个节点之后，服务变得不稳定，没有明显的变化。然后，在第三个停止后，法定人数丢失，所有单位都未安排。然后我再次启动了所有三个 etcd2 节点，并且在 60 秒内集群恢复了稳定状态。

随后的测试产生相同的结果。

我是否遇到了 etcd2、fleet 或 CoreOS 中的已知错误？

即使 etcd 因任何原因不可用，我是否可以修改设置以将单元安排到节点上？

最佳答案

我也经历过同样的事情。就我而言，当我运行 1 个特定单元时，它会导致一切都炸毁。预定的和完美运行的单元突然丢失，没有任何通知，甚至机器从集群中退出。

我仍然不确定确切的问题是什么，但我认为这可能与 etcd vs etcd2 有关。我在单元文件中有 etcd.service 的依赖项，这(我认为，不确定)导致 CoreOS 尝试启动 etcd.service，而 etcd2.service 已经在运行。在我的情况下，这可能会导致冲突，并弄乱了设备和机器的 etcd 注册表。

类似的事情可能会发生在你身上，所以我建议你检查每台主机是否正在运行 etcd 或 etcd2，并检查你的单元文件以查看它们依赖于哪个主机。

关于amazon-ec2 - CoreOS、Fleet 和 Etcd2 容错，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31249941/

29

4

0

文章推荐： c# - SQLite + Dapper:将值转换为枚举

文章推荐： visual-studio - TFS 查询(在 Visual Studio 中)以获取所有 checkin

amazon-ecs - AWS ECS(容器服务)虽然连接了 ECS 代理，但没有启动容器
尽管我的 EC2 实例(带有针对 ECS 优化的 AIM)正在运行 ecs 代理，但容器并未在我的 EC2 中启动。为了确认 ecs-agent 正在我的 EC2 实例上运行，我检查了: ecs 日志
amazon-ecs - ECS 任务的动态端口映射
我想在一个任务定义中使用客户端和服务器在 aws ecs 中运行套接字程序。当我使用 awsvpc 网络模式并每次连接到本地主机上的服务器时，我都可以运行它。这很好，所以我不需要知道服务器的 IP 地
amazon-ecs - 如何在没有负载均衡器的情况下访问 ECS 服务？
我有一个在 AWS ECS 上运行的 Docker 容器。我不想要负载均衡器，因为容器是用来处理 websocket 连接的。 https://aws.amazon.com/getting-start
amazon-web-services - 带有 `aws ecs run-task` 后跟 `aws ecs execute-command` 的 Amazon ECS 的 Docker 镜像中的交互式 shell
我想在我的 AWS ECS/Fargate 集群上的公共(public) Docker 镜像中启动交互式 shell，以便从集群内部运行网络/连接测试。似乎官方的方法是使用 aws ecs run-
amazon-ecs - 如何调试 ECS Fargate 服务由于弹性负载均衡器运行状况检查不正常而偶尔重启任务
我在 ECS Fargate 上托管了一个 Shiny 的应用程序。它运行得相当好，但偶尔在使用该应用程序时它会崩溃。我在事件选项卡中将其追溯到以下内容: service YYYY has start
amazon-ecs - 如何在 AWS ECS 容量提供程序中计算目标容量百分比
在 AWS ECS 中创建容量提供程序时。我们正在填充的值 Target capacity %，在超过这个值后我们的集群缩小，但我很好奇当前集群的这个值是如何计算的，如果我想检查当前的是什么集群的值(
amazon-ecs - 如何在 AWS ECS 容量提供程序中计算目标容量百分比
在 AWS ECS 中创建容量提供程序时。我们正在填充的值 Target capacity %，在超过这个值后我们的集群缩小，但我很好奇当前集群的这个值是如何计算的，如果我想检查当前的是什么集群的值(
amazon-ecs - 管道永远不会通过代码管道完成部署 AWS ECS Fargate 任务
我在 AWS 上设置了具有多个目标组和应用程序负载均衡器的 Fargate ecs 服务。它按预期运行。然后我尝试使用本教程设置管道 https://docs.aws.amazon.com/Amaz
amazon-ecs - 如何确定每个日期的 ECS 服务的 Cloudwatch 日志流
我有一个运行任务的 ECS 集群服务，可以使用 AWS 控制台查看其 Cloudwatch 日志流。如何为 awslogs-stream-prefix 设置日期，因为我想按日期识别日志流。 "c
amazon-ecs - 如何在 CodePipeline 中处理 ECS 部署以更改任务定义
我正在使用两个容器部署 ECS Fargate 任务:1 个反向代理 nginx 和 1 个 python 服务器。对于每个我有一个 ECR 存储库，我有一个 CI/CD CodePipeline 设
amazon-ecs - 在 ECS 部署中更新 Docker 镜像
我在 AWS ECS 上部署了一个 CloudFormation 堆栈，比如 teststack , 通过命令 aws cloudformation deploy --template-file ./
amazon-ecs - 使用 AWS ECS Fargate 进行水平和垂直自动扩展
我这里有一些具体的用例。我需要自动扩展在 ECS Fargate 上运行的分布式 Web 应用程序。问题是所有节点都需要在内存中保留相同的数据(因此增加节点数量无助于内存压力)。因此，只有在水平(添加
amazon-ecs - AWS ECS 任务内存和 CPU 分配
我正在寻找有关为 ECS 任务分配内存的指南。我正在为希望在服务器成本上尽可能便宜的客户运行 Rails 应用程序。我正在查看具有 2 个 CPU 和 4 GB 内存的中等服务器大小。大多数情况下，
docker - ECS Fargate 部署卡住，无法部署 ECS 服务
我是 ECS 新手，我正在尝试使用 Cloudformation 部署它。我通过查看文档以及从博客和一些文章中找到的一些示例来制作以下 cloudformation 模板。但是，由于某种原因，它在
amazon-ecs - 如何在基于 Python 的 ECS 任务中读取环境变量
也许这很愚蠢，但如果我创建一个 ECS 任务定义(例如参见 https://aws.amazon.com/blogs/compute/better-together-amazon-ecs-and-aw
amazon-ecs - memoryReservation 在带有 Fargate 的 ECS 上实际上做了什么？
ECS 的容器定义允许您指定 memoryReservation对于每个容器: The soft limit (in MiB) of memory to reserve for the contain
amazon-ecs - 无法将弹性 IP 地址关联到我的 AWS ECS 实例
我在 ca-central 区域创建了一个 AWS ECS 实例。它与每次更新服务时都会更改的动态公共(public) ip 一起使用。到目前为止一切都很好。由于需要一个公网静态IP，所以我在同一区
amazon-ecs - ECS TaskDefinition 创建失败，错误为 "Invalid containerPort'“
Invalid 'containerPort' setting for container 'prerenderContainer'.(Service: AmazonECS; Status Code:
amazon-web-services - 使用 ECS 容量提供程序和使用 ECS 集群中自动伸缩组的自动伸缩有什么区别？
如果我在 ECS 服务级别进行自动扩展，我看不到使用容量提供程序扩展 ECS 集群的意义: https://docs.aws.amazon.com/AmazonECS/latest/developer
amazon-ecs - 使用 ECS 进行 Prometheus DNS 服务发现
关闭。这个问题不符合 Stack Overflow guidelines 。它目前不接受答案。想改进这个问题？更新问题，使其成为 Stack Overflow 的 on-topic。 1年前关闭。

首页

博学

6Ren·AI

商城

amazon-ec2 - CoreOS、Fleet 和 Etcd2 容错