python - 阻止 celery 任务开始，直到完成具有相似参数的不同任务-6ren

python - 阻止 celery 任务开始，直到完成具有相似参数的不同任务

转载作者：行者123 更新时间：2023-12-03 14:46:28

26

4

假设我有一个 celery 任务，它需要两个参数:X(a,b)我需要使用以下两条规则来实现自定义并发逻辑:

X 的实例如果 a 的值不同，则可以同时运行.也就是说，如果 X(a=1,b=10)正在运行时 X(a=2,b=20)被添加到队列中，然后后者从队列中拉出并立即执行。

X 的实例如果 a 的值相同，则不能同时运行.也就是说，如果 X(a=1,b=10)正在运行时 X(a=1,b=20)被添加到队列中，那么后者必须在队列中等待，直到前者完成。

规则 #1 通过设置 worker_concurrency>1 与 celery 一起开箱即用。 ( docs)。规则 #2 是一个棘手的规则。
分布式任务锁定，如 docs 中所述在 this blog , 是一种让我接近我需要的方法。甚至还有一些库可以为您实现它( celery-singleton)。但是，回顾规则#2，这种方法似乎可以防止第二个任务在第一个任务完成之前排队。我需要它排队，直到第一个任务完成才在工作人员上执行。
有没有办法实现这个？ This SO question问了一个类似的问题，但到目前为止没有答案。

最佳答案

这似乎是使用 redis 的好例子。和绑定(bind) celery 任务。如果你还没有这样做，你也可以使用 redis 作为你的 celery 代理，如果你需要的话，也可以作为缓存层。这真是一把瑞士军刀。 Deploying redis也很简单。我强烈鼓励任何人更熟悉它。这是一个很好的工具，可以放在一个人的工具箱中。
我会稍微改变一下这个例子，因为我总是对单字符函数和变量感到困惑。

# Think of this as X(a,b) from the question
@task
def add(num1, num2):
    return num1 + num2

然后我们可以升级 add看起来更像这样:

# "bind" the task so we have access to all the Task base class functionality
# via "self".
# https://docs.celeryproject.org/en/latest/reference/celery.app.task.html#celery.app.task.Task.retry
@task(bind=True)
def add(self, num1, num2):
    if does_running_task_exist_with(num1):
        # requeue. Please visit the docs for "retry" mentioned above.
        # There are also max_retries and some other nice things.
        # Try again in 10s
        self.retry(countdown=10)
        return
    return num1 + num2

我们的 does_running_task_exist_with然后辅助函数将使用 redis 集。像所有 Set 实现一样，它们保证唯一性并且检查成员是否存在很快。

# Using https://github.com/andymccurdy/redis-py
import redis

def does_running_task_exist_with(some_number):
    # Connect to redis.
    # Using database number 2. You might be using db 0 for celery brokerage,
    # and db 1 for celery result storage. Using a separate DB is just nice
    # for isolation. Redis has up to 16.
    # Connects to localhost by default.
    redis_conn = redis.StrictRedis(db=2)
    # we try adding this number to the Set of currently processing numbers
    # https://redis.io/commands/sadd
    # Return value: the number of elements that were added to the set, 
    # not including all the elements already present into the set.
    members_added = redis_conn.sadd("manager_task_args", str(some_number))
    # Or shortcut it as "return members_added == 0". This here is 
    # more expressive though
    if members_added == 0:
        return True
    return False

好的。现在跟踪和决策已经到位。缺少的一件重要事情是:一旦 add任务完成，我们需要删除 num1从 redis 集中。让我们稍微调整一下功能。

import redis

@task(bind=True)
def add(self, num1, num2):
    if does_running_task_exist_with(num1):
        self.retry(countdown=10)
        return
    # Do actual work…
    result = num1 + num2
    # Cleanup
    redis_conn = redis.StrictRedis(db=2)
    redis_conn.srem("manager_task_args", str(num1))
    return result

但是如果事情出错了怎么办？如果添加失败怎么办？然后我们的 num1永远不会从集合中删除，我们的队列开始变得越来越长。我们不希望那样。你可以在这里做两件事:要么创建 a class-based task with an on_failure method , 或将其包装在 try-except-finally 中。我们将走 try-finally 路线，因为在这种情况下更容易遵循:

import redis

@task(bind=True)
def add(self, num1, num2):
    if does_running_task_exist_with(num1):
        self.retry(countdown=10)
        return
    try:
        result = num1 + num2
    finally:
        redis_conn = redis.StrictRedis(db=2)
        redis_conn.srem("manager_task_args", str(num1))
    return result

那应该这样做。请注意，您可能还想查看 redis connection pooling如果你有大量的任务。

关于python - 阻止 celery 任务开始，直到完成具有相似参数的不同任务，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/66180268/

26

4

0

文章推荐： javascript - Ionic 4 Deeplink 插件返回错误路由不匹配

文章推荐： docker - "docker stack deploy": where are docker images?

文章推荐： javascript - MapboxGL JS - 以较低的缩放级别显示 3d 建筑物

文章推荐： python - #X 格式说明符真的应该使 "0x"前缀大写吗？

jsp - 如何从JSP输出HTML <%! ... %> 阻止？
我刚开始学习JSP技术，遇到了瓶颈。如何从 JSP 声明 block ？这不起作用: ... 服务器说没有“out”。 U: 我确实知道如何使用返回字符串的方法重写代码，但是有没有办法在？
lucene - Elasticsearch 阻止
在一个字段中，我想设置一个具有自定义过滤器的自定义分析器-着眼于词干-因此，“闪存卡”和“闪存卡”的词根相同，因此返回的结果相同当我运行以下查询时，我的命中率很高，但是“闪存卡”和“闪存卡”各自返回
c# - 阻止 WM_QUIT
快速提问。我有一个通过 PInvoke 使用 native DLL 的应用程序，这个 DLL 可能会调用 PostQuitMessage()。如何避免？ (因为我的应用程序不应该关闭) 我试过 A
javascript - 阻止 $(this) 元素上的事件
一些给定的 HTML 文章，例如: Content 与一些基本的 Jquery 结合使用，例如: $(".some_
Javascript 阻止 css？
我正在构建一个灯箱相册。当第一个图像加载时，CSS 转换起作用。当加载后的每个图像都没有。任何想法为什么？加载第一张之后的照片，但没有过渡。 Image.prototype.load = functi
android - 阻止/禁用最近使用的应用程序按钮
这个问题在这里已经有了答案: Disable recent tasks button on Android 5.0 (2 个答案) 关闭 2 年前。我知道这个问题之前在这里被问过 Android
iphone - 阻止 UIAlertViewDelegate
我是 Objective-C 的新手，我只是想弄清楚我是否可以使用 block 或选择器作为 UIAlertView 的 UIAlertViewDelegate 参数 - 哪个更合适？我已经尝试了以
c - 为什么不接受()阻止？
我是 Linux (UNIX) 套接字下套接字编程的新手。我在 Internet 上找到了以下代码，用于为每个连接生成一个线程的 tcp 服务器。但是它不起作用。accept() 函数立即返回，不等待
阻止 recv() 返回少于请求字节的情况
recv()库函数手册页提到: It returns the number of bytes received. It normally returns any data available, up
typescript - 阻止 WebStorm 建议索引导入
我有一个用于其他项目的共享 ts 库。在这个库中有被同一个库的其他资源使用的资源。该库的结构分为 components/*、interfaces/*、services/* 等目录。在每个目录的根目录中
Flutter 阻止 ListView 以新行显示
我想在同一行中一个接一个地显示我的 ListView ，但 ListView 显示每个新行中的每个项目。我怎样才能防止换行显示。以便它显示为段落 ListView.builder( shr
reactjs - 阻止 `useSelector` 重新渲染组件？
我有一个包含数千行的表格。 import React from "react" import { useSelector } from "react-redux"; import { useEffec
haskell - 阻止 GHC 警告我一个特定的缺失模式
假设我通常希望收到关于代码中不完整模式的警告，但有时我知道某个函数的模式不完整，我知道这很好。是still true GHC 的警告粒度是每个模块的，并且没有办法更改有关特定功能或定义的警告？最佳
javascript - 我如何知道浏览器通知是否被 Windows 阻止
我的网络应用程序发送浏览器通知，我知道如何检查通知的浏览器权限，以及如果未授予权限，如何请求权限。但是，即使用户授予我的站点发送通知的权限，她可能仍然无法收到通知，因为它们 might be dis
xcode - 阻止 Xcode 将文本转换为超链接？
我有 Xcode 3.2.1，并且喜欢使用它，但是当我编辑文本中带有超链接的文件时(例如，带有引用的注释:# see http://example.com)Xcode 将文本变成可点击的超链接。尝试编
excel - 阻止 Excel 将日期转换为数字
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。我们不允许在 Stack Overflow 上提出有关通用计算硬件和软件的问题。您可以编辑问题，使其成为
php - 阻止 Controller 执行
我有一个在 MY_Controller 中运行的 acl。如果权限被拒绝，那么此刻，我只是执行 redirect('denied') - 这是一个非常基本的 Controller ，它加载一个非常基本
firefox - 阻止 Firefox 缓存本地主机？
我一直很好奇尝试从 Chrome 切换到 Firefox Quantum，但是对于 Web 开发遇到了一个我无法轻松解决的主要障碍——它正在缓存我的本地主机文件，因此当我尝试在本地主机加载各种 emb
xcode - 阻止 Xcode 记住我以前打开的项目
这真的让我很兴奋!在任何时候，我都会参与多个项目。当我退出Xcode时，下次打开Xcode时，我前一天的所有项目都会自动一一打开。经常我最终编辑错误的文件，AHHHHHHHHHHH!我可以阻止这种行
wiki - MediaWiki大量用户删除/合并/阻止
我的Wiki上有500个左右的Spambot和大约5个实际注册用户。我已经使用nuke删除了他们的页面，但是他们一直在重新发布。我已经使用reCaptcha控制了spambot的注册。现在，我只需要一

首页

博学

6Ren·AI

商城

python - 阻止 celery 任务开始，直到完成具有相似参数的不同任务