gpt4 book ai didi

kubernetes - GKE不会将节点缩减为零

转载 作者:行者123 更新时间:2023-12-02 12:01:39 25 4
gpt4 key购买 nike

GKE群集配置有群集/节点自动配置。

我创建了一个默认的节点池,可以在其上运行系统特定的Pod。每当请求带有GPU的Pod时,GKE都会自动创建新的启用GPU的节点池。

但是,无论何时删除此类Pod,GKE都不会将新创建的节点池缩减为零实例。相反,一个实例保持运行。如果没有请求GPU,则节点池应该达到最小大小,即零。

注意:

  • 对于GPU驱动程序,已在“kube-system” namespace 下创建了一个Daemonset,此Daemonset的Pod在每个启用GPU的节点上运行。

  • 我编辑了此Daemonset,还添加了标签““cluster-autoscaler.kubernetes.io/safe-to-evict”:“true”
    到 pod 。

    有人可以帮助将新创建的节点池缩减为零节点吗?

    更新:

    在新节点上运行的Pod是:

    fluentd-gcp(来自DaemonSet)

    库贝代理

    nvidia-gpu-device-plugin(来自DaemonSet)

    这些 pod 不应该被赶走吗?

    最佳答案

    默认情况下,GKE保留了额外的节点资源以进行快速Pod调度。这是自动缩放策略控制的默认行为。

    可以通过将策略设置为“优化利用”来更改此行为。

    https://cloud.google.com/kubernetes-engine/docs/concepts/cluster-autoscaler

    关于kubernetes - GKE不会将节点缩减为零,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60931160/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com