gpt4 book ai didi

google-cloud-run - 谷歌云运行准备情况检查 - 如何?

转载 作者:行者123 更新时间:2023-12-01 05:49:32 24 4
gpt4 key购买 nike

我在 https://cloud.google.com/run/docs/how-to 的文档中进行了相当广泛的搜索。 .我还在 console.cloud.google.com 中找到了 YAML,但我无法编辑它。有没有办法使用我可能错过的命令来设置它?

编辑:
我在 https://cloud.google.com/sdk/gcloud/reference/beta/container/clusters/create 中找不到任何内容关于它。

编辑2:

我正在寻找一种方法让谷歌云运行在容器中对我的应用程序进行就绪检查。与 kubernetes 相同的方式 - 此处示例:https://kubernetes.io/docs/tasks/configure-pod-container/configure-liveness-readiness-probes/ .问题是我不想在容器中的应用程序仍在旋转时让我的服务停机 30-60 秒。当我推送新版本时,Google 会立即重定向流量,导致用户等待很长时间。

编辑3:
这是我部署新版本后发出第一个初始请求所需的时间。
Postman request

编辑4:
我正在尝试启动的应用程序是在 Python 中。这是一个提供 tensorflow 模型的 flask 应用程序。我需要将几个文件加载到内存中。这在我的电脑上只需要 5-10 秒,但在云运行上需要更长的时间。

最佳答案

除了确认您的服务正在监听指定端口之外,Cloud Run 没有准备就绪检查。完成后,流量开始路由到新修订版,并且先前的服务修订版会在它们结束正在进行的请求时按比例缩小。

如果您的目标是确保服务在部署后尽快准备就绪,您可能会创建一个更重的入口点来处理更多的设置任务。

像这样的“更重”的入口点将有助于部署后的响应能力,但代价是冷启动速度变慢。

您可以在入口点中预先加载的示例(无论是在 BASH 脚本中还是在打开 HTTP 服务器之前的服务中):

  • 执行所有必要的设置任务,例如将文件加载到内存中。
  • 在全局状态下建立和保留任何客户端或与支持服务的连接。
  • 通过您的服务代码执行任何支持服务和资源可用的健康检查。
  • 预热容器内缓存以最小化第一响应。

  • 同样,这通过惩罚所有冷启动来优化部署后响应。

    https://cloud.google.com/run/docs/tips#optimizing_performance

    关于google-cloud-run - 谷歌云运行准备情况检查 - 如何?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56348839/

    24 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com