微服务17：微服务治理之异常驱逐

转载作者：我是一只小鸟更新时间：2023-10-03 23:02:12

35

4

★微服务系列

微服务1：微服务及其演进史微服务2：微服务全景架构微服务3：微服务拆分策略微服务4：服务注册与发现微服务5：服务注册与发现（实践篇）微服务6：通信之网关微服务7：通信之RPC 微服务8：通信之RPC实践篇（附源码）微服务9：服务治理来保证高可用微服务10：系统服务熔断、限流微服务11：熔断、降级的Hystrix实现（附源码）微服务12：流量策略微服务13：云基础场景下流量策略实现原理微服务14：微服务治理之重试微服务15：微服务治理之超时微服务16：微服务治理之熔断、限流。

1 介绍

大家都知道，一个主机（或称为节点）可以部署多个Pod，Pod作为Kubernetes中的最小部署单元。是一组一个或多个紧密关联的容器的集合，它们共享相同的网络命名空间和存储卷。一般来说，服务上云之后，我们的服务会配置 anti-affinity（反亲和调度），他有哪些利弊权衡呢:

affinity 可以实现就近部署，增强网络能力实现通信上的就近路由，减少网络的损耗。如同一个BCC聚类多个实例Pod。
anti-affinity 反亲和性主要是出于高可靠性考虑，尽量分散实例Pod，某个节点故障的时候，对应用的影响只是 N 分之一或者单实例。

所以，最终的部署结构可能是：同一个服务（如 Service A）的实例不会部署在同一个主机节点上（Node），即Node1上不会同时存在 Service-A-Ins1 和 Service-A-Ins2，这就好比如把鸡蛋分在不同的篮子里，不会因为一个主机节点故障导致全盘失败的风险。但是依然不能解决一个问题，就是主机上可能部署了别的服务，如Service-A和B、C、D混部，虽然你们运行在不同的主机上，但是如果因为BCD服务导致的故障把整个主机节点都拖垮了，依然会影响你们的稳定性，至少是你们某个实例的稳定性。所以需要强有力的解决方案来高保你们服务健壮存活着.

2 实例异常之后的解决方案

2.1 对集群的异常实例进行驱逐

下面以Istio为例子说明。

服务混部模型下，经常会因为某一个或者某几个实例的故障而导致整个服务可用性降低。适当的把故障的实例短暂的驱逐出集群，可以保证整个集群的健康。 ★ 这种手段在云基础上我们称之为离群检测（Outlier Detection）：当集群中的服务故障的时候，其实我们最优先的做法是先进行离群，然后再检查问题，处理问题并恢复故障。所以，能否快速的离群对系统的可用性很重要。 Outlier Detection 允许你对上游的服务进行扫描，然后根据你设置的参数来判断是否对服务进行离群。下面的配置表示每秒钟扫描一次上游主机，连续失败 2 次返回 5xx 错误码的所有主机会被移出负载均衡连接池 3 分钟，上游被离群的主机在集群中占比不应该超过10%。但无论比例多少，只要你集群下的服务实例>=2个，都将弹出至少1个主机。它有很详细的配置，参考。注意：3分钟之后回群，如果再被离群，则为上次离群时间+本次离群时间，即 3+3；默认恐慌阈值为0，不启用，建议设置30%（可调整比例）被离群，进入恐慌模式，不再驱逐.

                        
                          outlierDetection:
      consecutiveErrors: 2
      interval: 1s
      baseEjectionTime: 3m
      maxEjectionPercent: 10

2.2 单（实例）节点的长时间故障不可用

当一个集群实例保持长时间的异常，或者说在指定时间驱逐回归之后依然是异常状态，则说明该实例的环境（或者该实例所属的主机环境）始终保持在一个不健康的状态。比较好的自愈办法是：隔离并摘除流量，重启之后调度在另一台主机上去创建一个新实例，重新引入流量，达到故障恢复的目的。实例容器重建能力一般是采用容器健康探针来进行摘流和重启。需要注意的是，极端异常会引发批量重启，这其实是个缺陷。解决方案是PDB（Pod Disruption Budget），它负责中断预算，避免过度重启导致问题！PDB的作用就是通过控制 minAvailable(maxUnavailable)来控制存活的Pod实例，低于这个数，无论如何都不让重启了.

                        
                          apiVersion: policy/v1
kind: PodDisruptionBudget
metadata:
  name: svc-a-pdb
spec:
  minAvailable: 8  #svc-a至少要有8个实例是存活着得
  selector:
    matchLabels:
      app: svc-a

3 总结

云基础场景下的多副本服务的单个副本出故障或者异常的现象在业内还是很常见的，这边讲解了初级版的异常驱逐和容器重启，而且这种驱逐和重启是在平滑下执行的，对用户无感，让用户有一个更优良的使用体验。在后续的章节我们在了解下大集群模式下的高可用架构怎么设计.

最后此篇关于微服务17：微服务治理之异常驱逐的文章就讲到这里了,如果你想了解更多关于微服务17：微服务治理之异常驱逐的内容请搜索CFSDN的文章或继续浏览相关文章，希望大家以后支持我的博客！。

35

4

0

文章推荐： Redis最常见的5种应用场景

文章推荐：深入理解python虚拟机：生成器停止背后的魔法

文章推荐： 10.0探索API调试事件原理

文章推荐： Linux动态库

微 Controller 类型转换改进
关闭。此题需要details or clarity 。目前不接受答案。想要改进这个问题吗？通过 editing this post 添加详细信息并澄清问题. 已关闭 9 年前。 Improve th
微 Controller 寄存器的更干净的命名空间
使用微 Controller 时，通常您必须对寄存器进行写入和读取，为了使代码更具可读性，您需要定义寄存器地址及其位。这有点好，但是当您的寄存器名称彼此非常相似时，它很快就会变得困惑，例如此处所示 #
embedded - 微 Controller 环境中的原子操作是什么？
微 Controller 背景下的“原子操作”是什么？我正在研究 TI F28027 MCU。 The data sheet says that its operations are atomic
microcontroller - 微 Controller 的数据压缩
我正在用 PIC 微 Controller 做一个项目。我有一个 ADC 采样并将数据保存到 RAM 存储器，一旦 RAM 被填满，我需要使用 PIC 微 Controller 通过蓝牙发送它。我的
microcontroller - 微 Controller 中的堆栈内存分配
如何确定微 Controller 中特定程序所需的堆栈内存？例如，假设我有一个内部可能有许多子例程或线程的程序。在我开始执行程序之前，我想修复这个程序的堆栈大小。我如何标记堆栈的终点。最佳答案我
c - 微 Controller 的sprintf和printf有什么区别
我知道 printf 和 sprintf 之间的基本功能差异。但是，我想知道它们之间一些与时间/延迟相关的差异。显然，我想在我的一个自定义构建 RTOS 的任务中使用它。你怎么看？我想知道更多它会如
c - 微 Controller 编程
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 9 年前。 Improve this ques
嵌入式软件编程资源(微 Controller 、EPROM)
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以便用事实和引用来回答。关闭 5 年前。
logging - 微 Controller 上的错误记录
我有一个一般性的问题。我在微 Controller 上记录错误。但是微 Controller 的资源比 Windows 计算机更有限。在我的例子中，我将 64 个错误代码保存在一个队列中，由 Free
c - 微 Controller 中的主存储器是如何组织的？
关闭。此题需要details or clarity 。目前不接受答案。想要改进这个问题吗？通过 editing this post 添加详细信息并澄清问题. 已关闭 6 年前。 Improve th
c - 微 Controller 计数器溢出和计数
假设我有一个时钟速度为 20 Mhz 的 8 位定时器。计时器在多少时间内可以计数多远而不溢出。或者1秒内溢出多少次？我知道它可以数到 255 并且会溢出最佳答案时间和频率之间的关系是t = 1/
c - 微 Controller 的模块化编程
我正在开展一个全面的长期 C 编程项目，该项目需要模块化编程方法。作为设计的一部分，将创建库，因此我想确认头文件组织的正确/错误解释: 问题假设您正在创建一个库。经过深思熟虑，您决定您希望构想的最终
c - 微 Controller 中的内存映射
1. #define timers ((dual_timers *)0x03FF6000) 这是 ARM 微 Controller 中使用的内存映射定义结构定义在哪里 2. struct dua
c - 微 Controller 中的图像接收
我购买了 LinkSprite JPEG 彩色相机和 LPC1768 mbed 微 Controller 。通过“LinkSprite”相机，我可以拍摄 jpeg 格式的图像，根据他们提供的教程，我可
c - 微 Controller 中的全局定时器时间中断
我有很多不同的时间来跟踪我的设计，但没有什么是 super 关键的。 10 毫秒 +/- 几毫秒根本不是什么大问题。但是可能有 10 个不同的定时器同时在不同的周期进行计数，显然我没有足够的专用定时器
Android + PIC 微 Controller
是否可以通过串行端口与 PIC 单片机通信 Android 应用程序？我可以使用哪些低成本手机？对不起，我是哥伦比亚人。最佳答案不确定 PIC，但是 Arduino可能是一个很好的引用点，并且有一
c - 微 Controller 内存分配
今天我一直在思考以下问题: 在一台普通的 pc 中，当你分配一些内存时，你向操作系统请求它，它会跟踪哪些内存段被占用，哪些内存段没有被占用，并且不要让你弄乱其他程序的内存等。但是微 Controlle
c - 微 Controller 的键盘扫描
我已经为微 Controller 的键盘开发了一个 c 驱动程序。我想改变它，例如，当我按下 1 时，它会显示 1，直到我按下另一个数字。截至目前，数字只有在我按下数字时才会改变，这意味着一旦我松开键
c - 微 Controller 中的多线程
我有一个在线程之间共享的 volatile unsigned char array LedState[5] 变量。数组中的每个索引表示一个状态。根据每个状态，LED 将以不同的顺序闪烁。一个线程设置数
无法正确调用子程序微 Controller PIC18F
我有一个项目要对微 Controller PIC18F 进行编程，我必须将一个开关电路连接到微 Controller 板上，这个开关电路有一个电锁和一个蜂鸣器要连接到它。锁最初是通电的。假设当我发送

首页

博学

6Ren·AI

商城