- mongodb - 在 MongoDB mapreduce 中,如何展平值对象?
- javascript - 对象传播与 Object.assign
- html - 输入类型 ="submit"Vs 按钮标签它们可以互换吗?
- sql - 使用 MongoDB 而不是 MS SQL Server 的优缺点
我正在尝试this Matasano crypto challenge,其中涉及使用人为放慢的字符串比较功能对服务器进行定时攻击。它说使用“您选择的Web框架”,但是我不想安装Web框架,因此我决定使用HTTPServer class模块中内置的 http.server
。
我想出了一些可行的方法,但是它非常慢,因此我尝试使用 multiprocessing.dummy
内置的(记录不良)线程池来加快速度。它的速度要快得多,但是我注意到了一些奇怪的事情:如果我同时发出8个或更少的请求,它就可以正常工作。如果我不止这些,它会工作一段时间,并在看似随机的时间给我错误。错误似乎是不一致的,并不总是相同的,但是它们中通常包含Connection refused, invalid argument
,OSError: [Errno 22] Invalid argument
,urllib.error.URLError: <urlopen error [Errno 22] Invalid argument>
,BrokenPipeError: [Errno 32] Broken pipe
或urllib.error.URLError: <urlopen error [Errno 61] Connection refused>
。
服务器可以处理的连接数是否有限制?我认为线程本身并不是问题所在,因为我编写了一个简单的函数,无需运行Web服务器就可以进行慢速的字符串比较,并使用500个并发线程进行调用,并且运行良好。我不认为仅从多个线程发出请求就成为问题,因为我制作的爬虫使用了100个以上的线程(所有爬虫都同时向同一个网站发出请求),而且它们工作正常。看起来HTTPServer并不是要可靠地托管获得大量流量的生产网站,但令我惊讶的是它很容易崩溃。
我尝试从我的代码中逐渐删除看起来与问题无关的内容,就像我通常在诊断像这样的神秘错误时所做的那样,但这在这种情况下不是很有帮助。似乎在删除似乎无关的代码时,服务器可以处理的连接数量逐渐增加,但是并没有明确的崩溃原因。
是否有人知道如何增加我一次可以发出的请求数量,或者至少为什么会这样?
我的代码很复杂,但是我想出了一个简单的程序来演示问题:
#!/usr/bin/env python3
import os
import random
from http.server import BaseHTTPRequestHandler, HTTPServer
from multiprocessing.dummy import Pool as ThreadPool
from socketserver import ForkingMixIn, ThreadingMixIn
from threading import Thread
from time import sleep
from urllib.error import HTTPError
from urllib.request import urlopen
class FancyHTTPServer(ThreadingMixIn, HTTPServer):
pass
class MyRequestHandler(BaseHTTPRequestHandler):
def do_GET(self):
sleep(random.uniform(0, 2))
self.send_response(200)
self.end_headers()
self.wfile.write(b"foo")
def log_request(self, code=None, size=None):
pass
def request_is_ok(number):
try:
urlopen("http://localhost:31415/test" + str(number))
except HTTPError:
return False
else:
return True
server = FancyHTTPServer(("localhost", 31415), MyRequestHandler)
try:
Thread(target=server.serve_forever).start()
with ThreadPool(200) as pool:
for i in range(10):
numbers = [random.randint(0, 99999) for j in range(20000)]
for j, result in enumerate(pool.imap(request_is_ok, numbers)):
if j % 20 == 0:
print(i, j)
finally:
server.shutdown()
server.server_close()
print("done testing server")
concurrent.futures.ThreadPoolExecutor
,
concurrent.futures.ProcessPoolExecutor
和
multiprocessing.pool
代替
multiprocessing.dummy.pool
,但这些似乎都没有帮助。我尝试使用一个普通的
HTTPServer
对象(不使用
ThreadingMixIn
),这只会使事情运行非常缓慢,并且无法解决问题。我尝试使用
ForkingMixIn
,但也没有解决。
HTTPServer
,
ForkingMixIn
和
ThreadingMixIn
。这些都没有帮助。
ConnectionResetError: [Errno 54] Connection reset by peer
,
urllib.error.URLError: <urlopen error [Errno 54] Connection reset by peer>
,
OSError: [Errno 41] Protocol wrong type for socket
,
urllib.error.URLError: <urlopen error [Errno 41] Protocol wrong type for socket>
和
urllib.error.URLError: <urlopen error [Errno 22] Invalid argument>
的混合。
requests
而不是
urllib.request
描述的大多数事情,并遇到了类似的问题。
最佳答案
您正在使用默认的listen()
待办事项值,这可能是造成这些错误的主要原因。这不是已经建立连接的并发客户端数,而是在建立连接之前在侦听队列中等待的客户端数。将服务器类更改为:
class FancyHTTPServer(ThreadingMixIn, HTTPServer):
def server_activate(self):
self.socket.listen(128)
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
s.bind((HOST, PORT))
s.listen(BACKLOG)
while running:
conn, addr = s.accept()
do_something(conn, addr)
s.accept()
调用将阻塞,直到客户端连接为止。您可能有许多客户端尝试同时连接,并且根据您的应用程序,您可能无法调用
s.accept()
并以与客户端尝试连接一样快的方式调度客户端连接。待处理的客户端排队,该队列的最大大小由BACKLOG值确定。如果队列已满,则客户端将失败,并显示“连接被拒绝”错误。
do_something(conn, addr)
调用,因此服务器可以返回到mainloop和
s.accept()
调用。
s.accept()
调用之前超时。
ulimit
错误,否则不要担心
Too many open files
,但是如果您想将积压增加到128以上,请对
socket.SOMAXCONN
进行一些研究。这是一个好的开始:
https://utcc.utoronto.ca/~cks/space/blog/python/AvoidSOMAXCONN
关于python - 从urllib.request向HTTPServer发出许多并发请求时的神秘异常,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36075676/
我正在尝试更新我的 jtable(更改值并按 Enter 键),但出现错误。由于大小原因,错误未完整。我认为其余部分只是 c3p0 池连接工具生成的不相关信息。 假设 起初,我认为这可能是 c3p0
每当我有两个水平并排的元素并指定了右和/或左填充和/或边距时,元素之间通常会在我指定的上方和上方有空格。我希望有人能告诉我如何消除该空间(没有像负边距这样的笨拙东西)。 请注意:我并不是在寻找替代的多
String[] parts = msg.split(" +\n?"); String room = parts[0]; System.out.println(msg); Sy
我知道“一定有什么东西被改变了”,但我的代码似乎在一夜之间无缘无故地崩溃了。 我的服务器目录结构是这样的: / /scripts /audit /other_things 我在“scripts”文件夹
我正在尝试了解 GCM 的工作原理。为此,我复制/粘贴 http://developer.android.com/ 的代码在“实现 GCM 客户端”部分中提出。 从服务器发送消息是可行的,但是当我的客
在生成随机整数时,我发现了一些有趣的事情(至少对我而言),我无法向自己解释,所以我想我会把它贴在这里。 我的需求很简单:我要生成随机积分 (Int32) ID 并旨在最大程度地减少冲突。生成时间不是问
在这里https://stackoverflow.com/a/19915925/4673197我了解到我可以通过设置 IFS 将字符串拆分为数组。 在这里https://stackoverflow.c
我现在正在为我的 CS 测试学习,并尝试编写代码,以明文形式给出整个 IMDB 数据库,找到电影中共同点最多的 Actor 。我已经差不多完成了,只是不断遇到一个奇怪的 KeyError。这是我的代码
在 Android 平台上开发了几个月之后,我仍然有一个悬而未决的问题。很久以前,我注意到我有一个 Activity 不符合应用程序主题的其余部分。这意味着默认情况下,Activity 的字体颜色是白
本周,我注意到我的团队 Azure 门户上有一个持续的网络作业。 团队中没有人表示他们已经部署了它,或者熟悉它。我找到了这个博客: https://azure.microsoft.com/en-ca/
所以我正在制作一个小型闲置游戏,我的部分努力是格式化所有数字,以便它们之间有逗号(出于美观目的)。我成功地让我的货币 Energy 带有这些逗号,但我很难添加其他变量。我用了num.toLocaleS
我遇到了一个我以前从未见过的奇怪问题,我认为它一定是一些我在代码中没有看到的简单问题。 我有一个项目,其中定义了 2 个 Windows 服务。一个我称为 DataSyncService,另一个称为
我有这个jsfiddle一次有效。 function toggle_off(itemID){ alert(itemID+'->'+document.getElementById(itemID).g
更新:已解决,我是白痴,谢谢大家! Okay little bit weird.. I just created a layout file for list items, I can see it
问题:这段代码究竟在做什么? 另外:“w”的使用方式是否是某种现有算法?我试图弄清楚函数的意图,或者至少描述它产生的数字种类。 上下文:我正在查看 Martin O'Leary 的“Fantasy M
你能帮帮我吗?我正在将自己传递给它自己的纯虚函数。 n->dataCallback(handler, n, hangup); 其中 n 是我的类指针,dataCallback 是它自己的(纯)虚函数(
我知道这里有数百万篇关于这个异常(exception)的帖子,但我不明白这里的这个。我有一个极端简单的示例管道服务: [ServiceContract] public interface ISRARi
此代码有效,但它如何不实际调用任何列出的方法。它有效,但它的工作原理和原因似乎几乎是神奇的。我实际上从未调用过 Equals、GetHashCode 或 Compare,但代码有效。我也从不在实现两个
警告: Element 'TextStyle' from SDK library 'ui.dart' is implicitly hidden by 'text_style.dart'. 代码摘录:
我有一个似乎无法解开的谜。我有这个非常简单的单元测试,它使用了一个非常简单的自定义属性。该属性仅添加到甚至未实例化的 1 个类。我计算属性被构建的次数。由于类 MyDummyClass 上的属性,我希
我是一名优秀的程序员,十分优秀!