gpt4 book ai didi

python - 检查 celery warm shutdown 是否正在进行任务

转载 作者:太空宇宙 更新时间:2023-11-04 05:30:54 39 4
gpt4 key购买 nike

长话短说

有没有办法判断我们的 celery worker 是否进入热关机状态?换句话说,我可以检查是否有待处理的 SIGTERM 吗?我有一个重新安排自己的任务,但我想避免在有等待关闭的情况下重新安排自己,以避免延迟热关闭。像这样:

if not self.shutdown_pending():
self.retry(countdown=5, max_retries=3)

实际上,除了重新安排事情之外,我希望能够在收到 SIGTERM 后立即完全退出当前工作,以便我可以尽快重新启动我的工作人员新代码部署:

@app.task(bind=True)
def my_work_task(self):
work = get_work()
for item in work:
if self.shutdown_pending():
logger.info("Shutdown detected. Bailing.")
return
item.process()

背景

我有一项任务需要花费不同的时间(从几秒到几分钟不等)。我正在使用一个分钟的 celery-beat 时间表来最初调用任务,但是如果我只需要少量的工作,比如说,十秒就可以完成,那么我想立即重新调用任务次以避免等待 50 秒等待下一个 celery beat 进来,因为新的工作很可能会在这段时间内可用。

所有这些都是为了尽量减少处理我的工作项的延迟。我想避免 worker 坐在那里无所事事的 50 秒时间段,因为在那段时间可能有一些工作可用。请注意,工作根据数据库中项目的“过期”而变得“准备就绪”,这就是为什么我使用 celery beat 只是在它们可用时清理它们而不是直接触发任务。

我的任务看起来像这样:

@app.task(bind=True)
def my_work_task(self):
work = get_work()
do_some_work(work)
# if this was just a short bit of work reschedule ourselves
# immediately to avoid wasting time waiting for the
# next celery beat.
if len(work) < SMALL_WORK_THRESHOLD:
self.retry(countdown=5, max_retries=3)

这一切都很好,除了一件事:当我重新加载我的工作人员时(通过发送 SIGTERM),我最终可能会等待一个工作人员重新安排自己,每次可能都有大量的工作。每次调用可能需要几分钟,直到我达到我的 max_retries 值。这使得部署新代码成为一个问题,因为工作处理几乎会停止长达几分钟。

最佳答案

遗憾的是,没有其他类似 question 中提到的简单解决方案.

你唯一能做的就是改变方法或使用 SIGKILL,在这种情况下,只需确保使用任务结果后端来了解你可能丢失了哪些任务,或者你是否在数据库上保留您可能不需要的状态。

根据我的个人经验,我总是使用 mongodb 来注册任务的星标和结束。这让我可以看到由于机器崩溃而从未完成的任务(我使用的是 CELERY_ACKS_LATE),如果我希望某个任务在整个云上一次只运行一次,还可以执行全局锁定。这样,如果 SIGTERM 在特定时间后不工作,我可以发送 SIGKILL 而不会丢失工作。

希望对你有帮助

关于python - 检查 celery warm shutdown 是否正在进行任务,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37154591/

39 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com