- mongodb - 在 MongoDB mapreduce 中,如何展平值对象?
- javascript - 对象传播与 Object.assign
- html - 输入类型 ="submit"Vs 按钮标签它们可以互换吗?
- sql - 使用 MongoDB 而不是 MS SQL Server 的优缺点
我正在尝试this Matasano crypto challenge,其中涉及使用人为放慢的字符串比较功能对服务器进行定时攻击。它说使用“您选择的Web框架”,但是我不想安装Web框架,因此我决定使用HTTPServer class模块中内置的 http.server
。
我想出了一些可行的方法,但是它非常慢,因此我尝试使用 multiprocessing.dummy
内置的(记录不良)线程池来加快速度。它的速度要快得多,但是我注意到了一些奇怪的事情:如果我同时发出8个或更少的请求,它就可以正常工作。如果我不止这些,它会工作一段时间,并在看似随机的时间给我错误。错误似乎是不一致的,并不总是相同的,但是它们中通常包含Connection refused, invalid argument
,OSError: [Errno 22] Invalid argument
,urllib.error.URLError: <urlopen error [Errno 22] Invalid argument>
,BrokenPipeError: [Errno 32] Broken pipe
或urllib.error.URLError: <urlopen error [Errno 61] Connection refused>
。
服务器可以处理的连接数是否有限制?我认为线程本身并不是问题所在,因为我编写了一个简单的函数,无需运行Web服务器就可以进行慢速的字符串比较,并使用500个并发线程进行调用,并且运行良好。我不认为仅从多个线程发出请求就成为问题,因为我制作的爬虫使用了100个以上的线程(所有爬虫都同时向同一个网站发出请求),而且它们工作正常。看起来HTTPServer并不是要可靠地托管获得大量流量的生产网站,但令我惊讶的是它很容易崩溃。
我尝试从我的代码中逐渐删除看起来与问题无关的内容,就像我通常在诊断像这样的神秘错误时所做的那样,但这在这种情况下不是很有帮助。似乎在删除似乎无关的代码时,服务器可以处理的连接数量逐渐增加,但是并没有明确的崩溃原因。
是否有人知道如何增加我一次可以发出的请求数量,或者至少为什么会这样?
我的代码很复杂,但是我想出了一个简单的程序来演示问题:
#!/usr/bin/env python3
import os
import random
from http.server import BaseHTTPRequestHandler, HTTPServer
from multiprocessing.dummy import Pool as ThreadPool
from socketserver import ForkingMixIn, ThreadingMixIn
from threading import Thread
from time import sleep
from urllib.error import HTTPError
from urllib.request import urlopen
class FancyHTTPServer(ThreadingMixIn, HTTPServer):
pass
class MyRequestHandler(BaseHTTPRequestHandler):
def do_GET(self):
sleep(random.uniform(0, 2))
self.send_response(200)
self.end_headers()
self.wfile.write(b"foo")
def log_request(self, code=None, size=None):
pass
def request_is_ok(number):
try:
urlopen("http://localhost:31415/test" + str(number))
except HTTPError:
return False
else:
return True
server = FancyHTTPServer(("localhost", 31415), MyRequestHandler)
try:
Thread(target=server.serve_forever).start()
with ThreadPool(200) as pool:
for i in range(10):
numbers = [random.randint(0, 99999) for j in range(20000)]
for j, result in enumerate(pool.imap(request_is_ok, numbers)):
if j % 20 == 0:
print(i, j)
finally:
server.shutdown()
server.server_close()
print("done testing server")
concurrent.futures.ThreadPoolExecutor
,
concurrent.futures.ProcessPoolExecutor
和
multiprocessing.pool
代替
multiprocessing.dummy.pool
,但这些似乎都没有帮助。我尝试使用一个普通的
HTTPServer
对象(不使用
ThreadingMixIn
),这只会使事情运行非常缓慢,并且无法解决问题。我尝试使用
ForkingMixIn
,但也没有解决。
HTTPServer
,
ForkingMixIn
和
ThreadingMixIn
。这些都没有帮助。
ConnectionResetError: [Errno 54] Connection reset by peer
,
urllib.error.URLError: <urlopen error [Errno 54] Connection reset by peer>
,
OSError: [Errno 41] Protocol wrong type for socket
,
urllib.error.URLError: <urlopen error [Errno 41] Protocol wrong type for socket>
和
urllib.error.URLError: <urlopen error [Errno 22] Invalid argument>
的混合。
requests
而不是
urllib.request
描述的大多数事情,并遇到了类似的问题。
最佳答案
您正在使用默认的listen()
待办事项值,这可能是造成这些错误的主要原因。这不是已经建立连接的并发客户端数,而是在建立连接之前在侦听队列中等待的客户端数。将服务器类更改为:
class FancyHTTPServer(ThreadingMixIn, HTTPServer):
def server_activate(self):
self.socket.listen(128)
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
s.bind((HOST, PORT))
s.listen(BACKLOG)
while running:
conn, addr = s.accept()
do_something(conn, addr)
s.accept()
调用将阻塞,直到客户端连接为止。您可能有许多客户端尝试同时连接,并且根据您的应用程序,您可能无法调用
s.accept()
并以与客户端尝试连接一样快的方式调度客户端连接。待处理的客户端排队,该队列的最大大小由BACKLOG值确定。如果队列已满,则客户端将失败,并显示“连接被拒绝”错误。
do_something(conn, addr)
调用,因此服务器可以返回到mainloop和
s.accept()
调用。
s.accept()
调用之前超时。
ulimit
错误,否则不要担心
Too many open files
,但是如果您想将积压增加到128以上,请对
socket.SOMAXCONN
进行一些研究。这是一个好的开始:
https://utcc.utoronto.ca/~cks/space/blog/python/AvoidSOMAXCONN
关于python - 从urllib.request向HTTPServer发出许多并发请求时的神秘异常,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36075676/
SQLite、Content provider 和 Shared Preference 之间的所有已知区别。 但我想知道什么时候需要根据情况使用 SQLite 或 Content Provider 或
警告:我正在使用一个我无法完全控制的后端,所以我正在努力解决 Backbone 中的一些注意事项,这些注意事项可能在其他地方更好地解决......不幸的是,我别无选择,只能在这里处理它们! 所以,我的
我一整天都在挣扎。我的预输入搜索表达式与远程 json 数据完美配合。但是当我尝试使用相同的 json 数据作为预取数据时,建议为空。点击第一个标志后,我收到预定义消息“无法找到任何内容...”,结果
我正在制作一个模拟 NHL 选秀彩票的程序,其中屏幕右侧应该有一个 JTextField,并且在左侧绘制弹跳的选秀球。我创建了一个名为 Ball 的类,它实现了 Runnable,并在我的主 Draf
这个问题已经有答案了: How can I calculate a time span in Java and format the output? (18 个回答) 已关闭 9 年前。 这是我的代码
我有一个 ASP.NET Web API 应用程序在我的本地 IIS 实例上运行。 Web 应用程序配置有 CORS。我调用的 Web API 方法类似于: [POST("/API/{foo}/{ba
我将用户输入的时间和日期作为: DatePicker dp = (DatePicker) findViewById(R.id.datePicker); TimePicker tp = (TimePic
放宽“邻居”的标准是否足够,或者是否有其他标准行动可以采取? 最佳答案 如果所有相邻解决方案都是 Tabu,则听起来您的 Tabu 列表的大小太长或您的释放策略太严格。一个好的 Tabu 列表长度是
我正在阅读来自 cppreference 的代码示例: #include #include #include #include template void print_queue(T& q)
我快疯了,我试图理解工具提示的行为,但没有成功。 1. 第一个问题是当我尝试通过插件(按钮 1)在点击事件中使用它时 -> 如果您转到 Fiddle,您会在“内容”内看到该函数' 每次点击都会调用该属
我在功能组件中有以下代码: const [ folder, setFolder ] = useState([]); const folderData = useContext(FolderContex
我在使用预签名网址和 AFNetworking 3.0 从 S3 获取图像时遇到问题。我可以使用 NSMutableURLRequest 和 NSURLSession 获取图像,但是当我使用 AFHT
我正在使用 Oracle ojdbc 12 和 Java 8 处理 Oracle UCP 管理器的问题。当 UCP 池启动失败时,我希望关闭它创建的连接。 当池初始化期间遇到 ORA-02391:超过
关闭。此题需要details or clarity 。目前不接受答案。 想要改进这个问题吗?通过 editing this post 添加详细信息并澄清问题. 已关闭 9 年前。 Improve
引用这个plunker: https://plnkr.co/edit/GWsbdDWVvBYNMqyxzlLY?p=preview 我在 styles.css 文件和 src/app.ts 文件中指定
为什么我的条形这么细?我尝试将宽度设置为 1,它们变得非常厚。我不知道还能尝试什么。默认厚度为 0.8,这是应该的样子吗? import matplotlib.pyplot as plt import
当我编写时,查询按预期执行: SELECT id, day2.count - day1.count AS diff FROM day1 NATURAL JOIN day2; 但我真正想要的是右连接。当
我有以下时间数据: 0 08/01/16 13:07:46,335437 1 18/02/16 08:40:40,565575 2 14/01/16 22:2
一些背景知识 -我的 NodeJS 服务器在端口 3001 上运行,我的 React 应用程序在端口 3000 上运行。我在 React 应用程序 package.json 中设置了一个代理来代理对端
我面临着一个愚蠢的问题。我试图在我的 Angular 应用程序中延迟加载我的图像,我已经尝试过这个2: 但是他们都设置了 src attr 而不是 data-src,我在这里遗漏了什么吗?保留 d
我是一名优秀的程序员,十分优秀!