gpt4 book ai didi

python-3.x - 请求返回响应 447

转载 作者:行者123 更新时间:2023-12-02 14:53:55 25 4
gpt4 key购买 nike

我正在尝试使用请求和 BeautifulSoup 抓取网站。当我运行代码来获取网页的标签时,soup 对象是空白的。我把request对象打印出来,看请求是否成功,不成功。打印结果显示响应 447。我找不到 447 作为 HTTP 状态代码的含义。有谁知道我如何才能成功连接和抓取网站?

代码:

r = requests.get('https://foobar)
soup = BeautifulSoup(r.text, 'html.parser')
print(soup.get_text())

Output:
''

当我打印请求对象时:

print(r)

Output:
<Response [447]>

最佳答案

您的事件很可能已被网站确认,因此它阻止了您的访问,您可以通过在对网站的请求中包含 header 来解决此问题。

import bs4
import requests
session=requests.session()
headers={"User-Agent":"Mozilla/5.0 (X11; Linux x86_64; rv:60.0) Gecko/20100101 Firefox/60.0","Accept":"text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8"}
req=session.get(url,headers=headers)
soup=bs4.BeautifulSoup(req.text)

关于python-3.x - 请求返回响应 447,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53983250/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com