gpt4 book ai didi

kubernetes - 如何根据负载自动缩放pod数量?

转载 作者:行者123 更新时间:2023-12-03 16:26:20 25 4
gpt4 key购买 nike

我们有一个大部分时间都相当空闲的服务,因此如果我们可以在服务没有收到任何请求时删除所有 pod 对我们来说会很棒,比如 30 分钟,并且在下次有新请求时Kubernetes 将创建第一个 pod 并处理响应。

是否可以将最小 pod 实例数设置为 0?

我发现目前Kubernetes不支持这个,有什么办法可以实现吗?

最佳答案

这在 Kubernetes 中不受 nginx、apache 或应用引擎(如 puma 等 Web 服务器支持)的支持。 , passenger , gunicorn , unicorn甚至 Google App Engine Standard它们可以被软启动,然后在第一个请求出现的那一刻启动,缺点是你的第一个请求总是会变慢。 (Kubernetes pod 不必以这种方式运行可能有一些基本原理,我可以看到很多设计更改或必须为这种非常具体的情况创建新的工作负载类型)

如果 Pod 处于空闲状态,它就不会消耗那么多资源。您可以调整 pod 的值 resources请求/限制,以便您请求少量 CPU/内存,并将限制设置为更高数量的 CPU/内存。让 Pod 始终运行的好处是,理论上,您的第一个请求永远不必等待很长时间才能获得响应。

关于kubernetes - 如何根据负载自动缩放pod数量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53330838/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com