gpt4 book ai didi

python - 网站在浏览器中打开但在 Python 中打开时返回 403

转载 作者:太空宇宙 更新时间:2023-11-04 03:14:40 29 4
gpt4 key购买 nike

有一个网站很高兴在浏览器中打开,但在 Python 中打开时返回 403 HTTP 错误,如下所示:

from bs4 import BeautifulSoup
import urllib2

link = 'http://niezalezna.pl/'

r = urllib2.urlopen(link).read()
soup = BeautifulSoup(r, 'lxml')

print soup.prettify()

该网站是一种流行的新闻服务。然后是否有可能使 URL 在使用上面的一段代码打开时返回 HTTP 403 错误?谢谢,

最佳答案

感谢上面的评论,找到了答案。代码如下,完整的答案可以在这里找到:Changing user agent on urllib2.urlopen

from bs4 import BeautifulSoup
import urllib2

link = 'http://niezalezna.pl/'

opener = urllib2.build_opener()
opener.addheaders = [('User-agent', 'Mozilla/5.0')]
response = opener.open(link)

soup = BeautifulSoup(response, 'lxml')

print soup.prettify()

关于python - 网站在浏览器中打开但在 Python 中打开时返回 403,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36705812/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com