- ubuntu12.04环境下使用kvm ioctl接口实现最简单的虚拟机
- Ubuntu 通过无线网络安装Ubuntu Server启动系统后连接无线网络的方法
- 在Ubuntu上搭建网桥的方法
- ubuntu 虚拟机上网方式及相关配置详解
CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.
这篇CFSDN的博客文章Python使用 Beanstalkd 做异步任务处理的方法由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.
使用 Beanstalkd 作为消息队列服务,然后结合 Python 的装饰器语法实现一个简单的异步任务处理工具. 。
最终效果 。
定义任务
1
2
3
4
5
6
7
|
from
xxxxx.job_queue
import
JobQueue
queue
=
JobQueue()
@queue
.task(
'task_tube_one'
)
def
task_one(arg1, arg2, arg3):
# do task
|
提交任务
1
|
task_one.put(arg1
=
"a"
, arg2
=
"b"
, arg3
=
"c"
)
|
然后就可以由后台的 work 线程去执行这些任务了.
实现过程 。
1、了解 Beanstalk Server 。
Beanstalk is a simple, fast work queue. https://github.com/kr/beanstalkd 。
Beanstalk 是一个 C 语言实现的消息队列服务。 它提供了通用的接口,最初设计的目的是通过异步运行耗时的任务来减少大量Web应用程序中的页面延迟。针对不同的语言,有不同的 Beanstalkd Client 实现。 Python 里就有 beanstalkc 等。我就是利用 beanstalkc 来作为与 beanstalkd server 通信的工具.
2、任务异步执行实现原理 。
beanstalkd 只能进行字符串的任务调度。为了让程序支持提交函数和参数,然后由woker执行函数并携带参数。需要一个中间层来将函数与传递的参数注册.
实现主要包括3个部分
Subscriber: 负责将函数注册到 beanstalk 的一个tube上,实现很简单,注册函数名和函数本身的对应关系。(也就意味着同一个分组(tube)下不能有相同函数名存在)。数据存储在类变量里.
1
2
3
4
5
6
|
class
Subscriber(
object
):
FUN_MAP
=
defaultdict(
dict
)
def
__init__(
self
, func, tube):
logger.info(
'register func:{} to tube:{}.'
.
format
(func.__name__, tube))
Subscriber.FUN_MAP[tube][func.__name__]
=
func
|
JobQueue: 方便将一个普通函数转换为具有 Putter 能力的装饰器 。
1
2
3
4
5
6
7
8
|
class
JobQueue(
object
):
@classmethod
def
task(
cls
, tube):
def
wrapper(func):
Subscriber(func, tube)
return
Putter(func, tube)
return
wrapper
|
Putter: 将函数名、函数参数、指定的分组组合为一个对象,然后 json 序列化为字符串,最后通过 beanstalkc 推送到beanstalkd 队列.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
|
class
Putter(
object
):
def
__init__(
self
, func, tube):
self
.func
=
func
self
.tube
=
tube
# 直接调用返回
def
__call__(
self
,
*
args,
*
*
kwargs):
return
self
.func(
*
args,
*
*
kwargs)
# 推给离线队列
def
put(
self
,
*
*
kwargs):
args
=
{
'func_name'
:
self
.func.__name__,
'tube'
:
self
.tube,
'kwargs'
: kwargs
}
logger.info(
'put job:{} to queue'
.
format
(args))
beanstalk
=
beanstalkc.Connection(host
=
BEANSTALK_CONFIG[
'host'
], port
=
BEANSTALK_CONFIG[
'port'
])
try
:
beanstalk.use(
self
.tube)
job_id
=
beanstalk.put(json.dumps(args))
return
job_id
finally
:
beanstalk.close()
|
Worker: 从 beanstalkd 队列中取出字符串,然后通过 json.loads 反序列化为对象,获得 函数名、参数和tube。最后从 Subscriber 中获得 函数名对应的函数代码,然后传递参数执行函数.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
|
class
Worker(
object
):
worker_id
=
0
def
__init__(
self
, tubes):
self
.beanstalk
=
beanstalkc.Connection(host
=
BEANSTALK_CONFIG[
'host'
], port
=
BEANSTALK_CONFIG[
'port'
])
self
.tubes
=
tubes
self
.reserve_timeout
=
20
self
.timeout_limit
=
1000
self
.kick_period
=
600
self
.signal_shutdown
=
False
self
.release_delay
=
0
self
.age
=
0
self
.signal_shutdown
=
False
signal.signal(signal.SIGTERM,
lambda
signum, frame:
self
.graceful_shutdown())
Worker.worker_id
+
=
1
import_module_by_str(
'pear.web.controllers.controller_crawler'
)
def
subscribe(
self
):
if
isinstance
(
self
.tubes,
list
):
for
tube
in
self
.tubes:
if
tube
not
in
Subscriber.FUN_MAP.keys():
logger.error(
'tube:{} not register!'
.
format
(tube))
continue
self
.beanstalk.watch(tube)
else
:
if
self
.tubes
not
in
Subscriber.FUN_MAP.keys():
logger.error(
'tube:{} not register!'
.
format
(
self
.tubes))
return
self
.beanstalk.watch(
self
.tubes)
def
run(
self
):
self
.subscribe()
while
True
:
if
self
.signal_shutdown:
break
if
self
.signal_shutdown:
logger.info(
"graceful shutdown"
)
break
job
=
self
.beanstalk.reserve(timeout
=
self
.reserve_timeout)
# 阻塞获取任务,最长等待 timeout
if
not
job:
continue
try
:
self
.on_job(job)
self
.delete_job(job)
except
beanstalkc.CommandFailed as e:
logger.warning(e, exc_info
=
1
)
except
Exception as e:
logger.error(e)
kicks
=
job.stats()[
'kicks'
]
if
kicks <
3
:
self
.bury_job(job)
else
:
message
=
json.loads(job.body)
logger.error(
"Kicks reach max. Delete the job"
, extra
=
{
'body'
: message})
self
.delete_job(job)
@classmethod
def
on_job(
cls
, job):
start
=
time.time()
msg
=
json.loads(job.body)
logger.info(msg)
tube
=
msg.get(
'tube'
)
func_name
=
msg.get(
'func_name'
)
try
:
func
=
Subscriber.FUN_MAP[tube][func_name]
kwargs
=
msg.get(
'kwargs'
)
func(
*
*
kwargs)
logger.info(u
'{}-{}'
.
format
(func, kwargs))
except
Exception as e:
logger.error(e.message, exc_info
=
True
)
cost
=
time.time()
-
start
logger.info(
'{} cost {}s'
.
format
(func_name, cost))
@classmethod
def
delete_job(
cls
, job):
try
:
job.delete()
except
beanstalkc.CommandFailed as e:
logger.warning(e, exc_info
=
1
)
@classmethod
def
bury_job(
cls
, job):
try
:
job.bury()
except
beanstalkc.CommandFailed as e:
logger.warning(e, exc_info
=
1
)
def
graceful_shutdown(
self
):
self
.signal_shutdown
=
True
|
写上面代码的时候,发现一个问题:
通过 Subscriber 注册函数名和函数本身的对应关系,是在一个Python解释器,也就是在一个进程里运行的,而 Worker 又是异步在另外的进程运行,怎么样才能让 Worker 也能拿到和 Putter 一样的 Subscriber。最后发现通过 Python 的装饰器机制可以解决这个问题.
就是这句解决了 Subscriber 的问题 。
1
|
import_module_by_str(
'pear.web.controllers.controller_crawler'
)
|
1
2
3
4
5
|
# import_module_by_str 的实现
def
import_module_by_str(module_name):
if
isinstance
(module_name,
unicode
):
module_name
=
str
(module_name)
__import__
(module_name)
|
执行 import_module_by_str 时, 会调用 __import__ 动态加载类和函数。将使用了 JobQueue 的函数所在模块加载到内存之后。当 运行 Woker 时,Python 解释器就会先执行 @修饰的装饰器代码,也就会把 Subscriber 中的对应关系加载到内存.
实际使用可以看 https://github.com/jiyangg/Pear/blob/master/pear/jobs/job_queue.py 。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持我.
原文链接:https://www.jianshu.com/p/cc9cd2892ff8 。
最后此篇关于Python使用 Beanstalkd 做异步任务处理的方法的文章就讲到这里了,如果你想了解更多关于Python使用 Beanstalkd 做异步任务处理的方法的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。
我在网上搜索但没有找到任何合适的文章解释如何使用 javascript 使用 WCF 服务,尤其是 WebScriptEndpoint。 任何人都可以对此给出任何指导吗? 谢谢 最佳答案 这是一篇关于
我正在编写一个将运行 Linux 命令的 C 程序,例如: cat/etc/passwd | grep 列表 |剪切-c 1-5 我没有任何结果 *这里 parent 等待第一个 child (chi
所以我正在尝试处理文件上传,然后将该文件作为二进制文件存储到数据库中。在我存储它之后,我尝试在给定的 URL 上提供文件。我似乎找不到适合这里的方法。我需要使用数据库,因为我使用 Google 应用引
我正在尝试制作一个宏,将下面的公式添加到单元格中,然后将其拖到整个列中并在 H 列中复制相同的公式 我想在 F 和 H 列中输入公式的数据 Range("F1").formula = "=IF(ISE
问题类似于this one ,但我想使用 OperatorPrecedenceParser 解析带有函数应用程序的表达式在 FParsec . 这是我的 AST: type Expression =
我想通过使用 sequelize 和 node.js 将这个查询更改为代码取决于在哪里 select COUNT(gender) as genderCount from customers where
我正在使用GNU bash,版本5.0.3(1)-发行版(x86_64-pc-linux-gnu),我想知道为什么简单的赋值语句会出现语法错误: #/bin/bash var1=/tmp
这里,为什么我的代码在 IE 中不起作用。我的代码适用于所有浏览器。没有问题。但是当我在 IE 上运行我的项目时,它发现错误。 而且我的 jquery 类和 insertadjacentHTMl 也不
我正在尝试更改标签的innerHTML。我无权访问该表单,因此无法编辑 HTML。标签具有的唯一标识符是“for”属性。 这是输入和标签的结构:
我有一个页面,我可以在其中返回用户帖子,可以使用一些 jquery 代码对这些帖子进行即时评论,在发布新评论后,我在帖子下插入新评论以及删除 按钮。问题是 Delete 按钮在新插入的元素上不起作用,
我有一个大约有 20 列的“管道分隔”文件。我只想使用 sha1sum 散列第一列,它是一个数字,如帐号,并按原样返回其余列。 使用 awk 或 sed 执行此操作的最佳方法是什么? Accounti
我需要将以下内容插入到我的表中...我的用户表有五列 id、用户名、密码、名称、条目。 (我还没有提交任何东西到条目中,我稍后会使用 php 来做)但由于某种原因我不断收到这个错误:#1054 - U
所以我试图有一个输入字段,我可以在其中输入任何字符,但然后将输入的值小写,删除任何非字母数字字符,留下“。”而不是空格。 例如,如果我输入: 地球的 70% 是水,-!*#$^^ & 30% 土地 输
我正在尝试做一些我认为非常简单的事情,但出于某种原因我没有得到想要的结果?我是 javascript 的新手,但对 java 有经验,所以我相信我没有使用某种正确的规则。 这是一个获取输入值、检查选择
我想使用 angularjs 从 mysql 数据库加载数据。 这就是应用程序的工作原理;用户登录,他们的用户名存储在 cookie 中。该用户名显示在主页上 我想获取这个值并通过 angularjs
我正在使用 autoLayout,我想在 UITableViewCell 上放置一个 UIlabel,它应该始终位于单元格的右侧和右侧的中心。 这就是我想要实现的目标 所以在这里你可以看到我正在谈论的
我需要与 MySql 等效的 elasticsearch 查询。我的 sql 查询: SELECT DISTINCT t.product_id AS id FROM tbl_sup_price t
我正在实现代码以使用 JSON。 func setup() { if let flickrURL = NSURL(string: "https://api.flickr.com/
我尝试使用for循环声明变量,然后测试cols和rols是否相同。如果是,它将运行递归函数。但是,我在 javascript 中执行 do 时遇到问题。有人可以帮忙吗? 现在,在比较 col.1 和
我举了一个我正在处理的问题的简短示例。 HTML代码: 1 2 3 CSS 代码: .BB a:hover{ color: #000; } .BB > li:after {
我是一名优秀的程序员,十分优秀!