- ubuntu12.04环境下使用kvm ioctl接口实现最简单的虚拟机
- Ubuntu 通过无线网络安装Ubuntu Server启动系统后连接无线网络的方法
- 在Ubuntu上搭建网桥的方法
- ubuntu 虚拟机上网方式及相关配置详解
CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.
这篇CFSDN的博客文章Python使用 Beanstalkd 做异步任务处理的方法由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.
使用 Beanstalkd 作为消息队列服务,然后结合 Python 的装饰器语法实现一个简单的异步任务处理工具. 。
最终效果 。
定义任务
1
2
3
4
5
6
7
|
from
xxxxx.job_queue
import
JobQueue
queue
=
JobQueue()
@queue
.task(
'task_tube_one'
)
def
task_one(arg1, arg2, arg3):
# do task
|
提交任务
1
|
task_one.put(arg1
=
"a"
, arg2
=
"b"
, arg3
=
"c"
)
|
然后就可以由后台的 work 线程去执行这些任务了.
实现过程 。
1、了解 Beanstalk Server 。
Beanstalk is a simple, fast work queue. https://github.com/kr/beanstalkd 。
Beanstalk 是一个 C 语言实现的消息队列服务。 它提供了通用的接口,最初设计的目的是通过异步运行耗时的任务来减少大量Web应用程序中的页面延迟。针对不同的语言,有不同的 Beanstalkd Client 实现。 Python 里就有 beanstalkc 等。我就是利用 beanstalkc 来作为与 beanstalkd server 通信的工具.
2、任务异步执行实现原理 。
beanstalkd 只能进行字符串的任务调度。为了让程序支持提交函数和参数,然后由woker执行函数并携带参数。需要一个中间层来将函数与传递的参数注册.
实现主要包括3个部分
Subscriber: 负责将函数注册到 beanstalk 的一个tube上,实现很简单,注册函数名和函数本身的对应关系。(也就意味着同一个分组(tube)下不能有相同函数名存在)。数据存储在类变量里.
1
2
3
4
5
6
|
class
Subscriber(
object
):
FUN_MAP
=
defaultdict(
dict
)
def
__init__(
self
, func, tube):
logger.info(
'register func:{} to tube:{}.'
.
format
(func.__name__, tube))
Subscriber.FUN_MAP[tube][func.__name__]
=
func
|
JobQueue: 方便将一个普通函数转换为具有 Putter 能力的装饰器 。
1
2
3
4
5
6
7
8
|
class
JobQueue(
object
):
@classmethod
def
task(
cls
, tube):
def
wrapper(func):
Subscriber(func, tube)
return
Putter(func, tube)
return
wrapper
|
Putter: 将函数名、函数参数、指定的分组组合为一个对象,然后 json 序列化为字符串,最后通过 beanstalkc 推送到beanstalkd 队列.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
|
class
Putter(
object
):
def
__init__(
self
, func, tube):
self
.func
=
func
self
.tube
=
tube
# 直接调用返回
def
__call__(
self
,
*
args,
*
*
kwargs):
return
self
.func(
*
args,
*
*
kwargs)
# 推给离线队列
def
put(
self
,
*
*
kwargs):
args
=
{
'func_name'
:
self
.func.__name__,
'tube'
:
self
.tube,
'kwargs'
: kwargs
}
logger.info(
'put job:{} to queue'
.
format
(args))
beanstalk
=
beanstalkc.Connection(host
=
BEANSTALK_CONFIG[
'host'
], port
=
BEANSTALK_CONFIG[
'port'
])
try
:
beanstalk.use(
self
.tube)
job_id
=
beanstalk.put(json.dumps(args))
return
job_id
finally
:
beanstalk.close()
|
Worker: 从 beanstalkd 队列中取出字符串,然后通过 json.loads 反序列化为对象,获得 函数名、参数和tube。最后从 Subscriber 中获得 函数名对应的函数代码,然后传递参数执行函数.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
|
class
Worker(
object
):
worker_id
=
0
def
__init__(
self
, tubes):
self
.beanstalk
=
beanstalkc.Connection(host
=
BEANSTALK_CONFIG[
'host'
], port
=
BEANSTALK_CONFIG[
'port'
])
self
.tubes
=
tubes
self
.reserve_timeout
=
20
self
.timeout_limit
=
1000
self
.kick_period
=
600
self
.signal_shutdown
=
False
self
.release_delay
=
0
self
.age
=
0
self
.signal_shutdown
=
False
signal.signal(signal.SIGTERM,
lambda
signum, frame:
self
.graceful_shutdown())
Worker.worker_id
+
=
1
import_module_by_str(
'pear.web.controllers.controller_crawler'
)
def
subscribe(
self
):
if
isinstance
(
self
.tubes,
list
):
for
tube
in
self
.tubes:
if
tube
not
in
Subscriber.FUN_MAP.keys():
logger.error(
'tube:{} not register!'
.
format
(tube))
continue
self
.beanstalk.watch(tube)
else
:
if
self
.tubes
not
in
Subscriber.FUN_MAP.keys():
logger.error(
'tube:{} not register!'
.
format
(
self
.tubes))
return
self
.beanstalk.watch(
self
.tubes)
def
run(
self
):
self
.subscribe()
while
True
:
if
self
.signal_shutdown:
break
if
self
.signal_shutdown:
logger.info(
"graceful shutdown"
)
break
job
=
self
.beanstalk.reserve(timeout
=
self
.reserve_timeout)
# 阻塞获取任务,最长等待 timeout
if
not
job:
continue
try
:
self
.on_job(job)
self
.delete_job(job)
except
beanstalkc.CommandFailed as e:
logger.warning(e, exc_info
=
1
)
except
Exception as e:
logger.error(e)
kicks
=
job.stats()[
'kicks'
]
if
kicks <
3
:
self
.bury_job(job)
else
:
message
=
json.loads(job.body)
logger.error(
"Kicks reach max. Delete the job"
, extra
=
{
'body'
: message})
self
.delete_job(job)
@classmethod
def
on_job(
cls
, job):
start
=
time.time()
msg
=
json.loads(job.body)
logger.info(msg)
tube
=
msg.get(
'tube'
)
func_name
=
msg.get(
'func_name'
)
try
:
func
=
Subscriber.FUN_MAP[tube][func_name]
kwargs
=
msg.get(
'kwargs'
)
func(
*
*
kwargs)
logger.info(u
'{}-{}'
.
format
(func, kwargs))
except
Exception as e:
logger.error(e.message, exc_info
=
True
)
cost
=
time.time()
-
start
logger.info(
'{} cost {}s'
.
format
(func_name, cost))
@classmethod
def
delete_job(
cls
, job):
try
:
job.delete()
except
beanstalkc.CommandFailed as e:
logger.warning(e, exc_info
=
1
)
@classmethod
def
bury_job(
cls
, job):
try
:
job.bury()
except
beanstalkc.CommandFailed as e:
logger.warning(e, exc_info
=
1
)
def
graceful_shutdown(
self
):
self
.signal_shutdown
=
True
|
写上面代码的时候,发现一个问题:
通过 Subscriber 注册函数名和函数本身的对应关系,是在一个Python解释器,也就是在一个进程里运行的,而 Worker 又是异步在另外的进程运行,怎么样才能让 Worker 也能拿到和 Putter 一样的 Subscriber。最后发现通过 Python 的装饰器机制可以解决这个问题.
就是这句解决了 Subscriber 的问题 。
1
|
import_module_by_str(
'pear.web.controllers.controller_crawler'
)
|
1
2
3
4
5
|
# import_module_by_str 的实现
def
import_module_by_str(module_name):
if
isinstance
(module_name,
unicode
):
module_name
=
str
(module_name)
__import__
(module_name)
|
执行 import_module_by_str 时, 会调用 __import__ 动态加载类和函数。将使用了 JobQueue 的函数所在模块加载到内存之后。当 运行 Woker 时,Python 解释器就会先执行 @修饰的装饰器代码,也就会把 Subscriber 中的对应关系加载到内存.
实际使用可以看 https://github.com/jiyangg/Pear/blob/master/pear/jobs/job_queue.py 。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持我.
原文链接:https://www.jianshu.com/p/cc9cd2892ff8 。
最后此篇关于Python使用 Beanstalkd 做异步任务处理的方法的文章就讲到这里了,如果你想了解更多关于Python使用 Beanstalkd 做异步任务处理的方法的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。
对于 Metal ,如果对主纹理进行 mipmap 处理,是否还需要对多采样纹理进行 mipmap 处理?我阅读了苹果文档,但没有得到任何相关信息。 最佳答案 Mipmapping 适用于您将从中
我正在使用的代码在后端 Groovy 代码中具有呈现 GSP(Groovy 服务器页面)的 Controller 。对于前端,我们使用 React-router v4 来处理路由。我遇到的问题是,通过
我们正在 build 一个巨大的网站。我们正在考虑是在服务器端(ASP .Net)还是在客户端进行 HTML 处理。 例如,我们有 HTML 文件,其作用类似于用于生成选项卡的模板。服务器端获取 HT
我正在尝试将图像加载到 void setup() 中的数组中,但是当我这样做时出现此错误:“类型不匹配,'processing .core.PImage' does not匹配“processing.
我正在尝试使用其私有(private)应用程序更新 Shopify 上的客户标签。我用 postman 尝试过,一切正常,但通过 AJAX,它带我成功回调而不是错误,但成功后我得到了身份验证链接,而不
如何更改我的 Processing appIconTest.exe 导出的默认图标在窗口中的应用程序? 默认一个: 最佳答案 经过一些研究,我能找到的最简单的解决方案是: 进入 ...\process
我在 Processing 中做了一个简单的小游戏,但需要一些帮助。我有一个 mp3,想将它添加到我的应用程序中,以便在后台循环运行。 这可能吗?非常感谢。 最佳答案 您可以使用声音库。处理已经自带
我有几个这样创建的按钮: 在 setup() PImage[] imgs1 = {loadImage("AREA1_1.png"),loadImage("AREA1_2.png"),loadImage
我正在尝试使用 Processing 创建一个多人游戏,但无法弄清楚如何将屏幕分成两个以显示玩家的不同情况? 就像在 c# 中一样,我们有Viewport leftViewport,rightView
我一直在尝试使用 Moore 邻域在处理过程中创建元胞自动机,到目前为止非常成功。我已经设法使基本系统正常工作,现在我希望通过添加不同的功能来使用它。现在,我检查细胞是否存活。如果是,我使用 fill
有没有办法用 JavaScript 代码检查资源使用情况?我可以检查脚本的 RAM 使用情况和 CPU 使用情况吗? 由于做某事有多种方法,我可能会使用不同的方法编写代码,并将其保存为两个不同的文件,
我想弄清楚如何处理这样的列表: [ [[4,6,7], [1,2,4,6]] , [[10,4,2,4], [1]] ] 这是一个整数列表的列表 我希望我的函数将此列表作为输入并返回列表中没有重复的整
有没有办法在不需要时处理 MethodChannel/EventChannel ?我问是因为我想为对象创建多个方法/事件 channel 。 例子: class Call { ... fields
我有一个关于在 Python3 中处理 ConnectionResetError 的问题。这通常发生在我使用 urllib.request.Request 函数时。我想知道如果我们遇到这样的错误是否可
我一直在努力解决这个问题几个小时,但无济于事。代码很简单,一个弹跳球(粒子)。将粒子的速度初始化为 (0, 0) 将使其保持上下弹跳。将粒子的初始化速度更改为 (0, 0.01) 或任何十进制浮点数都
我把自己弄得一团糟。 我想在我的系统中添加 python3.6 所以我决定在我的 Ubuntu 19.10 中卸载现有的。但是现在每次我想安装一些东西我都会得到这样的错误: dpkg: error w
我正在努力解决 Rpart 包中的 NA 功能。我得到了以下数据框(下面的代码) Outcome VarA VarB 1 1 1 0 2 1 1 1
我将 Java 与 JSF 一起使用,这是 Glassfish 3 容器。 在我的 Web 应用程序中,我试图实现一个文件(图像)管理系统。 我有一个 config.properties我从中读取上传
所以我一直在Processing工作几个星期以来,虽然我没有编程经验,但我已经转向更复杂的项目。我正在编写一个进化模拟器,它会产生具有随机属性的生物。 最终,我将添加复制,但现在这些生物只是在屏幕上漂
有人知道 Delphi 2009 对“with”的处理有什么不同吗? 我昨天解决了一个问题,只是将“with”解构为完整引用,如“with Datamodule、Dataset、MainForm”。
我是一名优秀的程序员,十分优秀!