python - Celery+Django -- 具有数据库相关任务的原子事务-6ren

python - Celery+Django -- 具有数据库相关任务的原子事务

转载作者：太空宇宙更新时间：2023-11-03 17:22:30

24

4

在我当前使用 Django、Docker-Compose 和 Celery(以及其他)的项目中，基本上传文件函数 insertIntoDatabase 是从任务和 View 中调用的。 py 任务被延迟调用。

在数据库插入器.py中:

def insertIntoDatabase(datapoints, user, description): # datapoints is a list of dictionaries, user and description are just strings
    # convert data and upload to our database

在tasks.py中:

@app.task()
def db_ins_task(datapoints, user, description):
    from databaseinserter import insertIntoDatabase
    insertIntoDatabase(datapoints, user, description)

在views.py中:

with transaction.atomic():
    db_ins_task.delay(datapoints, user, description)

在将 Celery 引入项目之前，只是在 views.py 中直接调用 insertIntoDatabase，因此不会插入任何无效的数据点列表(即格式不正确)整个上传将被取消并回滚。然而，现在上传是在异步 celery 任务中，无效的上传不再被正确回滚。既然上传是一项任务，如何确保无效上传仍然被取消并完全撤消？ Django 1.9 似乎有一些新功能可能正是我所需要的:transaction.on_commit。然而，目前切换到 1.9 的主要问题是，我们项目中的一个重要依赖项 Django-Hstore 似乎并不兼容。 1.9 也处于 alpha 阶段，因此即使两者兼容，目前使用起来也并不理想。有没有办法在 Django 1.8 中做到这一点？

我还研究了 django_transaction_barrier 并尝试使用它，但没有成功。在tasks.py中我将任务更改为

@task(base=TransactionBarrierTask)
def db_ins_task(datapoints, user, description):
    from databaseinserter import insertIntoDatabase
    insertIntoDatabase(datapoints, user, description)

在views.py中我更改了任务执行:

with transaction.atomic():
    db_ins_task.apply_async_with_barrier(args=(data, user, description,))

但是，我的主要问题是，一旦收到任务，Celery 就会抛出一个关于意外关键字参数的错误:

worker_1   | Traceback (most recent call last):
worker_1   |   File "/usr/local/lib/python2.7/site-packages/celery/app/trace.py", line 240, in trace_task
worker_1   |     R = retval = fun(*args, **kwargs)
worker_1   |   File "/usr/local/lib/python2.7/site-packages/celery/app/trace.py", line 438, in __protected_call__
worker_1   |     return self.run(*args, **kwargs)
worker_1   | TypeError: db_ins_task() got an unexpected keyword argument '__transaction_barrier'

那么，解决这个问题的最佳方法是什么？我应该继续尝试使用 django_transaction_barrier (如果我确实将它用于正确的事情)？如果是这样，我做错/遗漏了什么会导致错误？如果没有，有什么更好的方法来从我的数据库中清除无效上传？

最佳答案

Celery 是一个异步任务运行程序，基本上一旦任务交给 celery，它就会立即生效。您不能跨进程边界进行事务，因为 celery 将作为工作线程运行。

您始终可以运行另一个任务来查找无效数据点并清理数据库。简而言之，您想要一个具有两阶段提交的分布式事务，但这并不容易实现，因为它有自己的问题，并且不确定在 Python 中是否可用。

关于python - Celery+Django -- 具有数据库相关任务的原子事务，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/32999857/

24

4

0

文章推荐： python - 在 Python 2 中安全导入具有 Unicode 名称的模块

文章推荐： Azure Centos 卸载我的数据驱动器

文章推荐： python - Pycharm更长的输出

celery - celery 拍打不正常
当我运行此命令进行 celery 节拍时。 [2013-06-27 02:17:05,936: INFO/MainProcess] Celerybeat: Starting... [2013-06-2
celery - Celery 任务可以在重启后存活吗？
我需要构建一个处理两种类型任务的系统。一种类型可以创建更多自身或另一种类型的任务。将有很少的 worker (2-3)和只有一个主机。最重要的要求是系统应该优雅地处理重新启动:即在重新启动时，正在进行
celery - 更改内置 celery 任务的超时(即 celery.backend_cleanup)
我们使用 Celery 4.2.1 和 Redis，并为我们的任务设置了全局软超时和硬超时。我们所有的自定义任务都设计为保持在限制范围内，但每天内置任务 backend_cleanup 任务最终都会因
celery - celery 延迟的阻塞版本？
我知道这违背了使用 Celery 的全部目的，但是是否有一个函数会阻塞直到结果返回？所以我可以调用 actual_result = MyTask.dont_delay(some_arg="foo")
celery - 更改内置 celery 任务的超时(即 celery.backend_cleanup)
我们使用 Celery 4.2.1 和 Redis，并为我们的任务设置了全局软超时和硬超时。我们所有的自定义任务都设计为保持在限制范围内，但每天内置任务 backend_cleanup 任务最终都会因
celery - celery 延迟的阻塞版本？
我知道这违背了使用 Celery 的全部目的，但是是否有一个函数会阻塞直到结果返回？所以我可以调用 actual_result = MyTask.dont_delay(some_arg="foo")
celery - Celery 中的回滚支持
我计划使用 celery 作为我的项目的任务管理组件。它几乎具有我的项目所需的所有功能。我将有一组可以独立执行或按指定顺序执行的任务。在顺序任务中，我希望能够在中间任务之一失败时执行清理/回滚。我想知
celery - Celery 工作节点到底是什么？
它是运行 Celery 的实际处理器还是另一个进程？在花中，我可以在工作池中看到多个进程吗？这两者之间有什么区别？最佳答案当您运行 celery worker 时，它会创建一个父进程来管理正在运行
python - 如何解决 celery 文件中带有关键字参数命名空间 ='"CELERY 错误的 celery worker 配置
我有一个名为 ShippingApp 的项目，我按照步骤设置了 celery worker。我将 celery 3.1.26.post2 与 python3.7 一起使用，当我想启动 Celery W
celery - 不能杀死 celery worker
尽我所能，我无法杀死这些 celery worker 。我跑: celery --app=my_app._celery:app status 我看到我有3个(我不明白为什么3个 worker = 2
celery - 使用命令行检查 celery 配置
我在 docker 容器中运行了 celery ，我想检查选项 CELERY_TASK_RESULT_EXPIRES = '3600' 是否已应用。我尝试使用 celery inspect conf
celery - 在 celery 中打破无限循环
我使用 celery.chord(...) 创建一组任务和一个方法，该方法在组中的所有任务完成后被调用。我使用 amqp 结果后端(但我想切换到 memcached)。我的 worker 每秒钟一
celery - 将生成的列表映射到 celery 中的任务的最佳方法
我正在寻找一些关于将任务生成的列表映射到 celery 中的另一个任务的最佳方法的建议。假设我有一个名为 parse 的任务，它解析 PDF 文档并输出页面列表。然后，每个页面都需要单独传递给另一个
celery - 在客户端/生产者上记录 celery
这不是关于如何捕获 celery worker 日志的问题。有什么方法可以捕获生产者上的 celery 日志记录。我想要的是捕获当我调用 task.delay(...) 或 task.apply_as
celery - 如何重新排列 celery 花默认列？
我正在使用以下版本: 花==0.9.3 celery ==4.3.0 这为我提供了包含多个列的任务页面的以下显示: 每次我进入这个页面时，我最终都会重新排列页面，使列的顺序不同，并将行的顺序更改为降序
celery - 安排 Celery 任务在其他任务完成后运行
我想完成这样的事情: results = [] for i in range(N): data = generate_data_slowly() res = tasks.process
celery - 如何在 celery 中安排链式任务
我想运行一个由beat 调度的复杂任务。让我们假设定义了默认的 add/mul 任务。 @app.on_after_configure.connect def setup_periodic_tasks
celery - 重新部署时如何避免中断正在运行的 Celery 任务？
我有一个应用程序，其中包含 celery worker 。当我部署这将杀死那些正在运行的进程。所以任务将开始，但永远不会完成，并且在部署完成时不会重新启动。避免此问题并在部署完成后重新启动这些任务
celery - 如何诊断挂起的 Celery worker
我正在开始使用 Celery 进行 Django 项目。出于本地开发目的，我根据这些说明使用 djcelery 和 djkombu(数据库传输)进行了设置 http://ask.github.com/
celery - 如何配置 Celery 在任务失败时发送电子邮件警报？
如何配置 celery 在任务失败时发送电子邮件警报？例如，我希望 Celery 在 3 个以上的任务失败或 10 个以上的任务被重试时通知我。是否可以使用 celery 或实用程序(例如花)，或

首页

博学

6Ren·AI

商城

python - Celery+Django -- 具有数据库相关任务的原子事务