gpt4 book ai didi

Python urllib 卡住特定的 URL

转载 作者:行者123 更新时间:2023-11-28 18:22:33 25 4
gpt4 key购买 nike

我正在尝试获取一个页面,但 urlopen 挂起并且从不返回任何内容,尽管该网页非常轻巧并且可以使用任何浏览器打开而没有任何问题

import urllib.request
with urllib.request.urlopen("http://www.planalto.gov.br/ccivil_03/_Ato2007-2010/2008/Lei/L11882.htm") as response:
print(response.read())

这个简单的代码只是在检索响应时卡住,但是如果您尝试打开 http://www.planalto.gov.br/ccivil_03/_Ato2007-2010/2008/Lei/L11882.htm打开没有问题

最佳答案

www.planalto.gov.br 正在使用用户代理检测。如果您指定有效的用户代理,请求将正确完成。 urllib 库没有崩溃,它只是在等待。

curl -H "User-Agent:Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.133 Safari/537.36" http://www.planalto.gov.br/ccivil_03/_Ato2007-2010/2008/Lei/L11882.htm

对我来说工作得很好但是

curl http://www.planalto.gov.br/ccivil_03/_Ato2007-2010/2008/Lei/L11882.htm

没有。

如 RPGillespie 所说,使用 urllib2 或请求添加用户代理 header (有关更多信息,请参阅 How do I set headers using python's urllib?)。

关于Python urllib 卡住特定的 URL,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43987450/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com