gpt4 book ai didi

google-app-engine - App Engine automatic_scaling 配置

转载 作者:太空宇宙 更新时间:2023-11-03 15:27:42 25 4
gpt4 key购买 nike

我试图通过设置 automatic_scaling 参数来减少我的 Google App Engine 费用。平均而言,我的应用程序有 7-10 个实例在运行,其中 2 或 3 个处于空闲状态。但有时,如所附图表中的凌晨 3 点到 6 点之间,事件实例和空闲实例之间的差异大得离谱。此外,我想减少事件实例的数量,从而增加最终用户的响应时间(设置 min_pending_latencymax_pending_latency)。但是,直到现在,这些设置都没有任何效果。

这是我的 app.yaml 配置:

automatic_scaling:
min_pending_latency: 250ms
max_pending_latency: 750ms
max_idle_instances: 2

Instances

最佳答案

同时设置 min_pending_latency max_pending_latency将混合消息发送到自动缩放器。

更一般地说,您可以调整自动缩放器以要么包含您的成本(为 max_idle_instances 设置低值和/或为 min_pending_latency 设置高值), 以提高您的可扩展性——也就是说,为流量激增保持低延迟(为 min_idle_instances 设置高值和/或为 max_pending_latency 设置低值)。

不要混合使用这两种调整 - 根据我的经验,这种“混合消息”永远不会对成本或激增期间的延迟产生良好影响。

是的,我正在努力让这些基本信息成为 Google Cloud Platform 官方文档的一部分——只是花费的时间比我希望的要长,这就是为什么与此同时,我正在发布这个答案。

一个更高级的替代方案,如果您非常确定您的流量随时间变化的模式、激增的可能性等等,是从自动缩放模块切换到基本缩放模块甚至手动缩放模块,写作您自己的代码通过 Modules API 启动和终止实例.

尽管如此,我不得不承认,这对我来说从来没有达到最佳效果,因为专门用于服务用户流量的模块(而不是任务队列或基于 cron 的“后端”工作)——我的用户激增和时间模式从来没有正如分析过去的记录所暗示的那样, future 的发展是可以预见的。所以,最后,我总是(为了用户流量服务)回到良好的旧自动缩放,也许通过适度的调整要么降低成本,改进可扩展性,正如我在上面所推荐的。

关于google-app-engine - App Engine automatic_scaling 配置,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32926142/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com