python - 接受 zip 文件进行处理的守护进程的建议-6ren

python - 接受 zip 文件进行处理的守护进程的建议

转载作者：太空宇宙更新时间：2023-11-04 01:44:22

27

4

我想写一个守护进程:

从包含 zip 文件路径的队列(sqs、rabbit-mq 等)中读取消息
更新数据库中的一条记录，如“此作业正在处理”之类的内容
读取上述存档的内容并将一行插入到数据库中，其中包含从找到的每个文件的文件元数据中剔除的信息
将每个文件复制到 s3
删除压缩文件
将作业标记为“完成”
阅读队列中的下一条消息，重复

这应该作为服务运行，并在有人通过网络前端上传文件时由排队的消息启动。上传者不需要立即看到结果，但上传会在后台进行相当方便的处理。

我精通 python，所以首先想到的是编写一个带有 twisted 的简单服务器来处理每个请求并执行上述过程。但是，我从来没有写过像这样可以在多用户环境中运行的东西。它不会每分钟或每小时处理数百个上传，但如果它能一次处理多个，那就太好了，合理的。我也不太熟悉编写多线程应用程序和处理阻塞等问题。

过去人们是如何解决这个问题的？我可以采取哪些其他方法？

在此先感谢您的帮助和讨论!

最佳答案

我用过 Beanstalkd作为排队守护进程效果非常好(一些近期处理和图像大小调整 - 过去几周到目前为止超过 200 万)。使用 zip 文件名(可能来自特定目录)将消息放入队列 [我在 JSON 中序列化命令和参数]，当您在工作客户端中保留消息时，除非您允许，否则没有其他人可以获得它它超时(当它返回队列以被拾取时)。

剩下的就是解压和上传到S3，这还有其他的库。

如果您想一次处理多个 zip 文件，请运行任意数量的工作进程。

关于python - 接受 zip 文件进行处理的守护进程的建议，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/758466/

27

4

0

文章推荐：比较复合类的pythonic方法？

文章推荐： c - 在 C 中打印 2D 打印功能

文章推荐： c - Xcode 和 visual studio 中的 OpenGl 结果差异

文章推荐： python - 重装 Xcode 后 Matplotlib 突然崩溃？

守护 ThreadGroup
一点睛线程可以设置为守护线程，ThreadGroup 也可以设置为守护 ThreadGroup，但是若将一个 ThreadGroup 设置为 deamon，也并不会影响线程的 daemon 属性，
python - 守护 python 脚本需要什么？
我有一个 python 脚本需要在启动时作为守护进程运行。进程从 tty(和 pdb)分离，但代码不运行。我已经将它缩小到一个最小的例子 import daemon from time import
ReactJS:setState 什么时候应该由 isMounted 守护？
reactjs isMounted API 的文档提到: You can use this method to guard asynchronous calls to setState() or fo
python - 守护 python 的 BaseHTTPServer
我正在开发一个需要嵌入 HTTP 服务器的守护进程。我正在尝试使用 BaseHTTPServer 来完成它，当我在前台运行它时，它工作正常，但是当我尝试将守护进程 fork 到后台时，它停止工作。我的
java - 使用 JSVC 守护 java 应用程序
我正在尝试使用 Apache Commons Daemon 使用 Daemon 接口(interface)来守护我的应用程序。 Java 应用程序本身不执行任何操作，只是写入 stout。我编译了j
python-3.x - python - 守护 bottlepy 脚本
我正在使用 Bootle Python Web Framework 在 Ubuntu 上开发网络应用程序。是否有任何有效的方法来守护启动默认 bottlepy 网络服务器的脚本？谢谢。 UPD:现在
ruby-on-rails - 如何使用 bluepill 守护 Rails 脚本
我一直使用 bluepill成功地守护简单的 Ruby 脚本。然而这一次，我有一个脚本，它也在加载 Rails 环境，因此我可以访问 Rails 应用程序及其各自模型的数据库连接。我使用的 bluep
python - 使用 python-daemon 守护 python 脚本-套接字问题
我试图守护一些代码，但我遇到了一些麻烦。如果我用 tklogger() 调用代码，它运行得很好。但是，如果我在守护程序上下文中调用它，我会得到以下跟踪信息: Traceback (most rece
python-3.x - 在 centos 7 上使用 systemd 守护 celery
我打算使用 systemd 将 celery 4.3.0 作为守护进程运行，但它给了我这个错误: 它会启动 worker 但会很快停止它们。但是，我可以通过键入以下命令手动运行工作人员: celery

首页

博学

6Ren·AI

商城

python - 接受 zip 文件进行处理的守护进程的建议