gpt4 book ai didi

python - 为什么我的 WSGI 应用总是在 environ ['PATH_INFO' ] 中获取 URL 解码路径?

转载 作者:行者123 更新时间:2023-11-28 18:44:15 25 4
gpt4 key购买 nike

我有一个简单的裸 WSGI 应用程序:

def application(environ, start_response):
start_response('200 OK', [('Content-Type','text/html')])
print('PATH_INFO:', environ['PATH_INFO'])
return [b'<p>Hello World</p>']

if __name__ == '__main__':
from wsgiref import simple_server
server = simple_server.make_server('0.0.0.0', 8080, application)
server.serve_forever()

我提出两个要求:

C:\>curl "http://localhost:8080/<foo>"
<p>Hello World</p>
C:\>curl "http://localhost:8080/%3Cfoo%3E"
<p>Hello World</p>

我得到这个输出:

C:\code>python foo.py
PATH_INFO: /<foo>
127.0.0.1 - - [09/Mar/2014 13:48:39] "GET /<foo> HTTP/1.1" 200 18
PATH_INFO: /<foo>
127.0.0.1 - - [09/Mar/2014 13:48:47] "GET /%3Cfoo%3E HTTP/1.1" 200 18

看看我的应用程序如何获取URL解码路径/<foo>即使客户请求 /%3Cfoo%3E .

它表明 wsgiref.simple_server 确保我的应用程序始终获得 environ['PATH_INFO'] 中的 URL 解码路径.

但是我在 PEP-3333 的任何地方都找不到这种行为的记录。能否请您指出记录此行为的官方文档?

最佳答案

来自实际 HTTP 请求行的 REQUEST_URI 的值,如果服务器使其可用,则为:

REQUEST_URI: '/%3Cfoo%3E'

即使您使用过,也可能是这种情况:

curl "http://localhost:8080/<foo>"

因为 curl 会在发送之前对 URL 进行编码以使用 % 转义符。

我认为 REQUEST_URI 不包含在任何 RFC 中,而是许多服务器提供的变量。但是你不能依赖它的存在,所以不要编写你的 WSGI 应用程序来依赖它的存在。

Web 服务器将在处理 REQUEST_URI 之前解码 % 转义。因此,最终在 PATH_INFO 中的结果将始终是:

PATH_INFO: '/<foo>'

解码由 WSGI 构建的 CGI 和相关 RFC 涵盖。

例如:

关于python - 为什么我的 WSGI 应用总是在 environ ['PATH_INFO' ] 中获取 URL 解码路径?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22280010/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com