gpt4 book ai didi

python - 为什么异步库比这个 I/O 绑定(bind)操作的线程慢?

转载 作者:IT老高 更新时间:2023-10-28 20:53:30 24 4
gpt4 key购买 nike

我正在编写一个用于枚举网站域名的python程序。例如,'a.google.com'。

首先,我使用 threading 模块来做到这一点:

import string
import time
import socket
import threading
from threading import Thread
from queue import Queue

'''
enumerate a site's domain name like this:
1-9 a-z + .google.com
1.google.com
2.google.com
.
.
1a.google.com
.
.
zz.google.com

'''

start = time.time()
def create_host(char):
'''
if char is '1-9a-z'
create char like'1,2,3,...,zz'
'''
for i in char:
yield i
for i in create_host(char):
if len(i)>1:
return False
for c in char:
yield c + i


char = string.digits + string.ascii_lowercase
site = '.google.com'


def getaddr():
while True:
url = q.get()
try:
res = socket.getaddrinfo(url,80)
print(url + ":" + res[0][4][0])
except:
pass
q.task_done()

NUM=1000 #thread's num
q=Queue()

for i in range(NUM):
t = Thread(target=getaddr)
t.setDaemon(True)
t.start()

for host in create_host(char):
q.put(host+site)
q.join()

end = time.time()

print(end-start)

'''
used time:
9.448670148849487
'''

后来,我读了一本书,说在某些情况下协程比线程快。所以,我重写了代码以使用 asyncio:

import asyncio
import string
import time


start = time.time()
def create_host(char):
for i in char:
yield i
for i in create_host(char):
if len(i)>1:
return False
for c in char:
yield c + i


char = string.digits + string.ascii_lowercase
site = '.google.com'

@asyncio.coroutine
def getaddr(loop, url):
try:
res = yield from loop.getaddrinfo(url,80)
print(url + ':' + res[0][4][0])
except:
pass

loop = asyncio.get_event_loop()
coroutines = asyncio.wait([getaddr(loop, i+site) for i in create_host(char)])
loop.run_until_complete(coroutines)

end = time.time()

print(end-start)


'''
time
120.42313003540039
'''

getaddrinfoasyncio版本为什么这么慢?我是否以某种方式滥用了协程?

最佳答案

首先,我无法重现几乎与您在我的 Linux 机器上看到的一样大的性能差异。我一直看到线程版本大约需要 20-25 秒,asyncio 版本大约需要 24-34 秒。

现在,为什么 asyncio 变慢了?有几件事促成了这一点。首先,asyncio 版本必须按顺序打印,但线程版本不需要。打印是 I/O,所以 GIL 可以在它发生时释放。这意味着可能有两个或更多线程可以同时打印,尽管在实践中它可能不会经常发生,并且可能不会对性能产生太大影响。

其次,更重要的是,getaddrinfoasyncio 版本实际上是 just calling socket.getaddrinfo in a ThreadPoolExecutor :

def getaddrinfo(self, host, port, *,
family=0, type=0, proto=0, flags=0):
if self._debug:
return self.run_in_executor(None, self._getaddrinfo_debug,
host, port, family, type, proto, flags)
else:
return self.run_in_executor(None, socket.getaddrinfo,
host, port, family, type, proto, flags)

它为此使用默认的 ThreadPoolExecutorwhich only has five threads :

# Argument for default thread pool executor creation.
_MAX_WORKERS = 5

对于这个用例,这几乎没有你想要的并行度。为了使其表现得更像 threading 版本,您需要使用具有 1000 个线程的 ThreadPoolExecutor,通过 loop.set_default_executor 将其设置为默认执行程序:

loop = asyncio.get_event_loop()
loop.set_default_executor(ThreadPoolExecutor(1000))
coroutines = asyncio.wait([getaddr(loop, i+site) for i in create_host(char)])
loop.run_until_complete(coroutines)

现在,这将使行为更等同于 threading,但实际情况是 您实际上并没有使用异步 I/O - 您只是在使用 threading 使用不同的 API。因此,您可以在这里做的最好的事情是与 threading 示例相同的性能。

最后,您实际上并没有在每个示例中运行等效代码 - threading 版本使用的是共享一个 queue.Queue 的 worker 池,而asyncio 版本为 url 列表中的每个项目生成一个协程。如果我制作 asyncio 版本以使用 asyncio.Queue 和协同程序池,除了删除打印语句并制作更大的默认执行程序之外,我得到基本相同两个版本的性能。这是新的 asyncio 代码:

import asyncio
import string
import time
from concurrent.futures import ThreadPoolExecutor

start = time.time()
def create_host(char):
for i in char:
yield i
for i in create_host(char):
if len(i)>1:
return False
for c in char:
yield c + i


char = string.digits + string.ascii_lowercase
site = '.google.com'

@asyncio.coroutine
def getaddr(loop, q):
while True:
url = yield from q.get()
if not url:
break
try:
res = yield from loop.getaddrinfo(url,80)
except:
pass

@asyncio.coroutine
def load_q(loop, q):
for host in create_host(char):
yield from q.put(host+site)
for _ in range(NUM):
yield from q.put(None)

NUM = 1000
q = asyncio.Queue()

loop = asyncio.get_event_loop()
loop.set_default_executor(ThreadPoolExecutor(NUM))
coros = [asyncio.async(getaddr(loop, q)) for i in range(NUM)]
loop.run_until_complete(load_q(loop, q))
loop.run_until_complete(asyncio.wait(coros))

end = time.time()

print(end-start)

每个的输出:

dan@dandesk:~$ python3 threaded_example.py
20.409344911575317
dan@dandesk:~$ python3 asyncio_example.py
20.39924192428589

但请注意,由于网络,存在一些可变性。它们有时都会比这慢几秒钟。

关于python - 为什么异步库比这个 I/O 绑定(bind)操作的线程慢?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26154125/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com