python - POST 请求始终返回 "Disallowed Key Characters"-6ren

python - POST 请求始终返回 "Disallowed Key Characters"

转载作者：太空宇宙更新时间：2023-11-03 15:50:24

27

4

我想从表格中检索大气颗粒物值(遗憾的是该网站不是英文的，所以请随意询问所有内容):我失败了 BeautifulSoup 的组合并使用 requests 发送 GET 请求，因为表动态地填充了 Bootstrap 和类似 BeautifulSoup 的解析器。找不到仍必须插入的值。

使用 Firebug，我检查了页面的每个角度，发现通过选择表格的不同日期，会发送一个 POST 请求(如您在 Referer 中看到的，该站点是 http://www.arpat.toscana.it/temi-ambientali/aria/qualita-aria/bollettini/index/regionale/ ，表在哪里):

POST /temi-ambientali/aria/qualita-aria/bollettini/aj_dati_bollettini HTTP/1.1
Host: www.arpat.toscana.it    
User-Agent: Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:50.0) Gecko/20100101 Firefox/50.0
Accept: */*    
Accept-Language: en-US,en;q=0.5
Accept-Encoding: gzip, deflate
Content-Type: application/x-www-form-urlencoded; charset=UTF-8
X-Requested-With: XMLHttpRequest
Referer: http://www.arpat.toscana.it/temi-ambientali/aria/qualita-aria/bollettini/index/regionale/26-12-2016
Content-Length: 114
Cookie: [...]
DNT: 1
Connection: keep-alive

具有以下参数:

v_data_osservazione=26-12-2016&v_tipo_bollettino=regionale&v_zona=&csrf_test_name=b88d2517c59809a529
b6f8141256e6ca

答案中的数据为 JSON 格式。

所以我开始制作我的个人 POST 请求，以便直接获取将填充表格的 JSON 数据。

在参数中，除了日期之外，还有 csrf_test_name是必需的:在这里我发现这个网站受到了 CSRF vulnerability 的保护;为了在参数中执行正确的查询，我需要一个 CSRF token :这就是为什么我对站点执行 GET 请求(请参阅 URL 的 POST 请求中的 Referer )并从 cookie 中获取 CSRF token ，如下所示:

r = get(url)
csrf_token = r.cookies["csrf_cookie_name"]

一天结束时，我的 CSRF token 和 POST 请求准备就绪，我将其发送...并且状态代码为 200，我总是得到 Disallowed Key Characters. !

在寻找此错误时，我总是看到有关 CodeIgniter 的帖子，(我认为)这不是我需要的:我尝试了 header 和参数的每种组合，但没有任何改变。在放弃之前BeautifulSoup和requests并开始学习Selenium ，我想弄清楚问题是什么:Selenium级别太高，低级库如 BeautifulSoup和requests让我学到很多有用的东西，所以我更愿意继续学习这两个。

代码如下:

from requests import get, post
from bs4 import BeautifulSoup
import datetime
import json

url = "http://www.arpat.toscana.it/temi-ambientali/aria/qualita-aria/bollettini/index/regionale/" # + %d-%m-%Y
yesterday = datetime.date.today() - datetime.timedelta(1)
date_object = datetime.datetime.strptime(str(yesterday), '%Y-%m-%d')
yesterday_string = str(date_object.strftime('%d-%m-%Y'))

full_url = url + yesterday_string
print("REFERER " + full_url)

r = get(url)
csrf_token = r.cookies["csrf_cookie_name"]
print(csrf_token)

# preparing headers for POST request
headers = {
    "Host": "www.arpat.toscana.it",
    "Accept" : "*/*",
    "Accept-Language" : "en-US,en;q=0.5",
    "Accept-Encoding" : "gzip, deflate",
    "Content-Type" : "application/x-www-form-urlencoded; charset=UTF-8",
    "X-Requested-With" : "XMLHttpRequest", # XHR
    "Referer" : full_url,
    "DNT" : "1", 
    "Connection" : "keep-alive"
}

# preparing POST parameters (to be inserted in request's body)
payload_string = "v_data_osservazione="+yesterday_string+"&v_tipo_bollettino=regionale&v_zona=&csrf_test_name="+csrf_token
print(payload_string)

# data -- (optional) Dictionary, bytes, or file-like object to send in the body of the Request.

# json -- (optional) json data to send in the body of the Request.
req = post("http://www.arpat.toscana.it/temi-ambientali/aria/qualita-aria/bollettini/aj_dati_bollettini",
    headers = headers, json = payload_string
)

print("URL " + req.url)

print("RESPONSE:")
print('\t'+str(req.status_code))
print("\tContent-Encoding: " + req.headers["Content-Encoding"])
print("\tContent-type: " + req.headers["Content-type"])
print("\tContent-Length: " + req.headers["Content-Length"])
print('\t'+req.text)

最佳答案

这段代码对我有用:

我使用request.Session()并且它保留所有cookie
我使用 data= 而不是 json=
最后我不需要所有带注释的元素
比较我使用的浏览器请求和代码请求 Charles Web 调试代理应用程序

代码:

import requests
import datetime

#proxies = {
#    'http': 'http://localhost:8888',
#    'https': 'http://localhost:8888',
#}

s = requests.Session()
#s.proxies = proxies # for test only

date = datetime.datetime.today() - datetime.timedelta(days=1)
date = date.strftime('%d-%m-%Y')

# --- main page ---

url = "http://www.arpat.toscana.it/temi-ambientali/aria/qualita-aria/bollettini/index/regionale/"

print("REFERER:", url+date)

r = s.get(url)

# --- data ---

csrf_token = s.cookies["csrf_cookie_name"]

#headers = {
    #'User-Agent': 'User-Agent: Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:50.0) Gecko/20100101 Firefox/50.0',
    #"Host": "www.arpat.toscana.it",
    #"Accept" : "*/*",
    #"Accept-Language" : "en-US,en;q=0.5",
    #"Accept-Encoding" : "gzip, deflate",
    #"Content-Type" : "application/x-www-form-urlencoded; charset=UTF-8",
    #"X-Requested-With" : "XMLHttpRequest", # XHR
    #"Referer" : url,
    #"DNT" : "1", 
    #"Connection" : "keep-alive"
#}

payload = {
    'csrf_test_name': csrf_token,   
    'v_data_osservazione': date,
    'v_tipo_bollettino': 'regionale',
    'v_zona': None,
}

url = "http://www.arpat.toscana.it/temi-ambientali/aria/qualita-aria/bollettini/aj_dati_bollettini"
r = s.post(url, data=payload) #, headers=headers)

print('Status:', r.status_code)
print(r.json())

代理:

关于python - POST 请求始终返回 "Disallowed Key Characters"，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41365999/

27

4

0

文章推荐： python - 从列表列表中删除子列表

文章推荐： python - 套接字无法建立连接

post - 防止双重HTTP POST
我已经制作了一个用于报名参加 Activity 的小应用程序。用户输入他们的数据，然后单击“登录我”。现在有时人们在数据库中是双倍的，完全相同的数据彼此之间很快被插入了两次。这只能表示某人单击了两次
post - post 方法中的未定义索引
这个问题在这里已经有了答案: 关闭 10 年前。 Possible Duplicate: PHP: “Notice: Undefined variable” and “Notice: Undefin
post - post 方法中的未定义索引
这个问题在这里已经有了答案: 关闭 10 年前。 Possible Duplicate: PHP: “Notice: Undefined variable” and “Notice: Undefin
post - 通过 HTTP 请求 POST 发送 Post 数据
我正在尝试将数据从 Textarea 发布到经典的 ASP 脚本，该脚本更新本地计算机上的 MS SQL，然后发布到另一台服务器上的 PHP 脚本。但是，执行以下操作不起作用，因为它会切断文本区域的数
ruby - 无法使用字符串 'post' 但使用 'POST' 识别表单。 html 包含 'post'
无效的代码: login_form = page.form_with(:method => 'post') 和有效的代码: login_form = page.form_with(:method =>
javascript - 当触发特定 POST 请求时修改 HTTP POST 请求正文(post 参数)
我希望能够在 HTTP Post 请求被触发时拦截它，然后修改其请求正文(或参数)，然后发送它。这怎么可能用 jquery/js 实现。谢谢最佳答案 Jquery ajax beforeSend
php - 你怎么写“Select (all) From (table) Where posting=$posting except this posting？(Mysql)
我想编写一个 Mysql 语句，从表(发布)中选择所有内容，其中标题类似于 $title 除了 $title 的标题。基本上我想显示某个帖子的所有相关帖子。我希望查询选择表中标题或详细信息中具有标题名
post - S3 POST 上传最小策略
我已经成功创建了一个简单的 HTML 表单，它将上传的文件发布到我的 Amazon S3 存储桶。我遵循了以下说明: http://aws.amazon.com/articles/1434 现在我正在
post - PHP POST 推荐人
我正在实现一个 PayPal IPN 页面，并想检查以确保请求真正来自 PayPal 而不是被欺骗。我假设 HTTP_REFERRER 不是一个好的检查方式？我已经尝试过这种方法，但变量只是空的。有
post - nginx 不将 POST 数据转发到 uwsgi -- [UPDATE] flask 不读取 post 数据
我有一个非常简单的设置有一个非常特殊的问题。该设置部署了 nginx Web 服务器以提供一些静态页面。它还有一个用于处理 POST 请求的后端 uwsgi 守护进程。我的nginx位置配置如下
javascript - 为什么我的 HTML POST 请求表单没有通过 Express app.post？如何将数字变量传递给另一个 POST 请求？
我认为我做错了什么，或者误解了我在网上阅读的有关 POST 和 GET 请求的内容。我在 myNumber.ejs 上有一个提交表单。当我按下提交时，有 Add.ejs 的 View 。 Add.ej
javascript - jQuery $.post 和 $.ajax POST 请求不适用于 Express 中的 app.post() 方法
我需要将数据从 Express 应用程序的前端发送到后端，然后使用需要显示该数据的 EJS 呈现页面。问题是 app.post() 方法，随后 res.render() 函数似乎没有完全执行或者当我
amazon-web-services - AWS cfn-hup 配置中的 post.add、post.update 与 post.delete
根据AWS Documentation对于 CloudFormation cfn-hup 帮助程序脚本，cfn-hup Hook 可以具有“要检测的以逗号分隔的条件列表”。这些条件/触发器可以是 po
php - HTTP 500 错误但确实将数据存储到数据库 - Wordpress new-post.php、post.php、edit-post.php 在更新数据结构和插件后无法正常工作
位于“wp-admin/includes/”的“post.php”文件中的 wordpress 函数“get_default_post_to_edit”无法正常工作。当我加载页面时:wp-admin
post - 带有空体的 Flutter post 方法
我使用请求库发布数据，但在服务器上收到空主体，没有传递任何数据。我在代码中遗漏了什么吗？ Map map = new Map(); map[csrfNameKey] = csrfName;
post - Siege 不发送 POST 数据
我正在尝试使用 siege 3.0.1 测试我的网站。但是好像siege不发送POST数据。这是我从网络浏览器收到的请求 POST / HTTP/1.0 Accept: text/html,appli
post - Feign 无法使用 POST 方法
我正在尝试为 stockfigher 游戏 api 编写包装器，只是为了了解 feign 是如何工作的，而且我在第一个 POST 方法中遇到了问题: @RequestMapping(method =
post - 如何使用 Jersey 获取原始 POST？
如何使用 Jersey 获取原始 POST？ @FormParam将不起作用，因为我发布的原始 JSON 不在任何特定的 POST 字段中。最佳答案 Jersey 带有一个用于将 JSON 映射到
post - 使用扩展创建 OData POST 实体
我正在尝试同时创建一个实体和两个子实体的实例。如果我将以下 JSON 发布到/user_objects 资源，它会很高兴地创建父 user_object 实体和链接的 User_object_att
post - IPV6 curl POST 请求
在 IPV6 中如何使用 IPV6 地址和端口号构建 CURL POST http 请求。任何类型的线程都将受到赞赏。尝试构建如下请求 >curl --interface 'http://[2001

首页

博学

6Ren·AI

商城

python - POST 请求始终返回 "Disallowed Key Characters"