azure - AKS 中的节点池未缩减至 0 个节点？-6ren

azure - AKS 中的节点池未缩减至 0 个节点？

转载作者：行者123 更新时间：2023-12-03 06:15:18

28

4

我的 AKS 集群中有两个节点池；默认节点池和“应用程序”节点池。我将默认节点池用于 Airflow 等服务，并使用应用程序节点池来运行 ETL 作业。但是，应用程序节点池永远不会扩展到零，即使我在很多小时内没有安排任何 ETL 作业也是如此。

我不明白为什么。有没有人对问题的根本原因有任何建议？

集群使用 Terraform 进行解聚。自动缩放器配置如下:

auto_scaler_profile {
    # (Optional) Maximum number of seconds the cluster autoscaler waits for pod termination when trying to scale down a node. Defaults to 600.
    max_graceful_termination_sec = 180
    # (Optional) How long after the scale up of AKS nodes the scale down evaluation resumes. Defaults to 10m.)
    scale_down_delay_after_add = "3m"
    # - (Optional) How long a node should be unneeded before it is eligible for scale down. Defaults to 10m.
    scale_down_unneeded = "3m"
    # (Optional) If true cluster autoscaler will never delete nodes with pods from kube-system (except for DaemonSet or mirror pods). Defaults to true.
    skip_nodes_with_system_pods = false
  }

应用程序节点池定义为:

resource "azurerm_kubernetes_cluster_node_pool" "main" {
  name                  = "application"
  kubernetes_cluster_id = azurerm_kubernetes_cluster.main.id
  vm_size               = "Standard_B4ms"
  enable_auto_scaling   = true
  min_count             = 0
  max_count             = 2
  max_pods              = 15

  node_labels = {
    "type" = "application"
  }

}

<小时/>

以下是有关 AKS 群集的一些相关详细信息:

k top nodes

NAME                                  CPU(cores)   CPU%   MEMORY(bytes)   MEMORY%   
aks-application-XXXXXXXX-vmss000000   55m          1%     1579Mi          12%       
aks-default-XXXXXXXX-vmss000000       677m         17%    7783Mi          61%

az aks nodepool show \
--resource-group <my-rg> \
--cluster-name <my-cluster> \
--name application \
--query "{min: minCount, max: maxCount}"

{
  "max": 2,
  "min": 0
}

az aks show \
--resource-group <my-rg> \
--name <my-cluster> \
--query autoScalerProfile

{
  "balanceSimilarNodeGroups": "false",
  "expander": "random",
  "maxEmptyBulkDelete": "10",
  "maxGracefulTerminationSec": "180",
  "maxNodeProvisionTime": "15m",
  "maxTotalUnreadyPercentage": "45",
  "newPodScaleUpDelay": "0s",
  "okTotalUnreadyCount": "3",
  "scaleDownDelayAfterAdd": "3m",
  "scaleDownDelayAfterDelete": "10s",
  "scaleDownDelayAfterFailure": "3m",
  "scaleDownUnneededTime": "3m",
  "scaleDownUnreadyTime": "20m",
  "scaleDownUtilizationThreshold": "0.5",
  "scanInterval": "10s",
  "skipNodesWithLocalStorage": "true",
  "skipNodesWithSystemPods": "false"
}

k get pods  --sort-by="{.spec.nodeName}" -A -o wide                                                                                                          
NAMESPACE      NAME                                  READY   STATUS    RESTARTS   AGE     NODE                                 
kube-system    azure-ip-masq-agent-XXXXX             1/1     Running   0          3d17h   aks-application-XXXXXXXX-vmss000000
kube-system    metrics-server-XXXXXXXXXX-XXXXX       2/2     Running   0          3d17h   aks-application-XXXXXXXX-vmss000000
kube-system    metrics-server-XXXXXXXXXX-XXXXX       2/2     Running   0          3d17h   aks-application-XXXXXXXX-vmss000000
kube-system    kube-proxy-XXXXX                      1/1     Running   0          3d17h   aks-application-XXXXXXXX-vmss000000
kube-system    csi-blob-node-XXXXX                   3/3     Running   0          3d17h   aks-application-XXXXXXXX-vmss000000
kube-system    csi-azurefile-node-XXXXX              3/3     Running   0          3d17h   aks-application-XXXXXXXX-vmss000000
kube-system    csi-azuredisk-node-XXXXX              3/3     Running   0          3d17h   aks-application-XXXXXXXX-vmss000000
kube-system    cloud-node-manager-XXXXX              1/1     Running   0          3d17h   aks-application-XXXXXXXX-vmss000000
kube-system    cloud-node-manager-XXXXX              1/1     Running   0          3d21h   aks-default-XXXXXXXX-vmss000000
airflow-prod   airflow-pgbouncer-XXXXXXXXXX-XXXXX    2/2     Running   0          3d21h   aks-default-XXXXXXXX-vmss000000
airflow-prod   airflow-triggerer-XXXXXXXXX-XXXXX     1/1     Running   0          3d21h   aks-default-XXXXXXXX-vmss000000
airflow-prod   airflow-webserver-XXXXXXXXX-XXXXX     1/1     Running   0          3d21h   aks-default-XXXXXXXX-vmss000000
airflow-prod   airflow-scheduler-XXXXXXXXX-XXXXX     2/2     Running   0          3d21h   aks-default-XXXXXXXX-vmss000000
kube-system    azure-ip-masq-agent-XXXXX             1/1     Running   0          3d21h   aks-default-XXXXXXXX-vmss000000
airflow-prod   airflow-postgresql-0                  1/1     Running   0          3d17h   aks-default-XXXXXXXX-vmss000000
kube-system    coredns-XXXXXXXXXX-XXXXX              1/1     Running   0          3d17h   aks-default-XXXXXXXX-vmss000000
kube-system    coredns-XXXXXXXXXX-XXXXX              1/1     Running   0          3d17h   aks-default-XXXXXXXX-vmss000000
kube-system    coredns-autoscaler-XXXXXXXXXX-XXXXX   1/1     Running   0          3d17h   aks-default-XXXXXXXX-vmss000000
airflow-prod   airflow-statsd-XXXXXXXX-XXXXX         1/1     Running   0          3d21h   aks-default-XXXXXXXX-vmss000000
kube-system    csi-azuredisk-node-XXXXX              3/3     Running   0          3d21h   aks-default-XXXXXXXX-vmss000000
kube-system    csi-azurefile-node-XXXXX              3/3     Running   0          3d21h   aks-default-XXXXXXXX-vmss000000
kube-system    csi-blob-node-XXXXX                   3/3     Running   0          3d21h   aks-default-XXXXXXXX-vmss000000
kube-system    konnectivity-agent-XXXXXXXXXX-XXXXX   1/1     Running   0          3d17h   aks-default-XXXXXXXX-vmss000000
kube-system    konnectivity-agent-XXXXXXXXXX-XXXXX   1/1     Running   0          3d17h   aks-default-XXXXXXXX-vmss000000
kube-system    kube-proxy-XXXXX                      1/1     Running   0          3d21h   aks-default-XXXXXXXX-vmss000000

最佳答案

某些系统 Pod 会阻止节点删除，因为系统 Pod 上没有节点关联。

您可以通过部署专用系统节点池来解决此问题。

关于azure - AKS 中的节点池未缩减至 0 个节点？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/76312329/

28

4

0

文章推荐： javascript - Angular 自定义验证

文章推荐： javascript - jQuery .on 更改事件绑定(bind)但不触发

文章推荐：在混合插槽中调用 Azure Durable Functions

c - OpenMP - 临界区 + 缩减
我目前正在学习使用 C 和 OpenMP 进行并行编程。我想编写简单的代码，其中两个共享值由多个线程递增。首先我使用了减少指令，它按预期工作。然后我改用关键启动关键部分的指令 - 它也有效。
kubernetes - 缩减 Kubernetes pod
我在用 kubectl scale --replicas=0 -f deployment.yaml 停止我所有正在运行的 pod 。请让我知道是否有更好的方法将所有正在运行的 pod 降到零，保持配置
c++ - CUDA 缩减 - 竞争条件？
请考虑我从教程中获得的以下代码和随附的解释性图像。其目的是演示 CUDA 的并行缩减。 #include "cuda_runtime.h" #include "device_launch_parame
c++ - CUDA 缩减，大阵列的方法
我有以下“Frankenstein”和减少代码，部分来自 common CUDA reduction slices ，部分来自 CUDA 示例。 __global__ void reduce
c - 数组中每个元素的 OpenMP 缩减
学习openMP // array b #pragma omp parallel for // reduction(&&: b[i])? for (i=2; i<=N; i++
c++ - 具有多个数组的共享内存的 CUDA 缩减
我目前正在使用以下 Reduction 函数通过 CUDA 对数组中的所有元素求和: __global__ void reduceSum(int *input, int *input2, int *i
python - 对连续的非连续切片进行 Numpy 缩减
假设我有两个 numpy 数组，形状为 (d, f) 的 A 和形状为 (d,) 的 I 包含 0..n 中的索引，例如 I = np.array([0, 0, 1, 0, 2, 1]) A = np
c - 多个值的 OpenMP argmin 缩减
我有一个例程，它使用一个循环来计算给定下方粒子表面的粒子的最小高度。此例程尝试随机位置并计算最小高度，然后返回 x, y, z 值，其中 z 是找到的最小高度。此例程可以与omp parallel
JavaScript - 映射、过滤、缩减。从数组转换为更深层次的树
每个视频都有一个有趣的时刻集合，每个时刻代表一个截屏有趣的时间或代表整个标题的时间。请注意，boxarts 和 interestingMoments 数组都位于树中的相同深度。使用 Array.zip
java - setFrameIcon 的动态 ImageIcon 缩减
我有一个 ImageIcon，用作打开此 skillsFrame 的按钮。此图像大小为 100x100 像素。正如您在屏幕截图中看到的那样，如果我只是放置图像，它太大了(这是预期的)。我的问题是关于
haskell - 如何在 Haskell 中进行多次 eta 缩减
我的任务是从 [[a]] 矩阵中获取一列。一个简单的解决方案是 colFields :: Int -> [[a]] -> [a] colFields n c = map (!! n) c 当减少一级
hadoop - Hadoop- map 缩减-java.lang.NoClassDefFoundError
问题是:如果我输入 hadoop jar MY.jar name_my_class /用户/用户/输入/用户/用户/输出我需要的所有类都在MY.jar中，为什么我仍然收到错误 java.lang.N
node.js - 使用 mongoosejs 进行 map 缩减
我正在尝试使用 Nodejs、mongoose 和 MongoDB 来进行映射缩减操作。我有一个相当平坦的模式结构，我想获取每个“命名”对象的值/日期对列表。 map 缩减功能显然有问题，但我不知道如
docker - 如何防止在 Kubernetes 中由 HPA 创建的特定时间段内新扩展的 pod 缩减？
我在 DigitalOcean 中设置了一个 Kubernetes 集群。集群配置为使用 HPA(Horizontal Pod Autoscaler)自动扩展。我想防止终止在过去 1 小时内按比例
mapreduce - View ( map 缩减)对 CloudAnt NoSQL 限制有何影响？
IBM Cloudant NoSQL 对每秒的查找、写入、查询有一些限制。在CloudAnt上我可以编写一个DesignDocument“View”。当我读取一个 View 时，该读取会对哪里产生
haskell - 用于学习惯用 Haskell 的资源(eta 缩减、符号中缀运算符、库等)
就目前情况而言，这个问题不太适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持，但这个问题可能会引发辩论、争论、民意调查或扩展讨论。如果您觉得这个问题可以改进并可能重新开放，visit
python - 使用 xlrd/xlwt 和循环迭代优化 Excel 数据收集/缩减
我最近刚刚开始使用 Python 编码，还有很多东西需要学习。我的代码的目标是从单元格中提取字符串，检查其字符长度并用特定缩写替换单词。然后，我将新字符串写入另一个 Excel 工作表中，并在所有数据
java - 使用 Java 8 Stream API 缩减 Map
我有一个以下形式的 map : Map> START 让 INNER 成为内部映射，即 Map 例如，我想在新 map 中缩小 START map Map END 它们具有相同的键，但具有不同的值。特
lambda-calculus - lambda 演算中的 Beta 缩减 : Order of evaluation important?
给定以下 lambda 表达式，其中 \ 类似于 lambda: (\kf.f(\c.co)km)(\x.dox)(\le.le) 如果我将(\c.co)k转换成ko是不是错了？我这样做了，显然，这是
c++ - Intel 编译器 (C++) 问题与 std::vector 上的 OpenMP 缩减
从 OpenMP 4.0 开始，支持用户定义的缩减。所以我在 C++ 中完全从 here 定义了对 std::vector 的归约。 .它适用于 GNU/5.4.0 和 GNU/6.4.0，但它返回随

首页

博学

6Ren·AI

商城

azure - AKS 中的节点池未缩减至 0 个节点？