gpt4 book ai didi

python - Web 抓取导致 403 禁止错误

转载 作者:太空宇宙 更新时间:2023-11-03 14:46:34 25 4
gpt4 key购买 nike

我正在尝试使用 BeautifulSoup 通过网络从 SeekingAlpha 中抓取每家公司的 yield 。但是,该站点似乎正在检测到正在使用网络抓取工具?我收到“HTTP 错误 403:禁止”

我试图抓取的页面是:https://seekingalpha.com/symbol/AMAT/earnings

有谁知道可以做些什么来绕过这个?

最佳答案

您应该尝试将 User-Agent 设置为请求 header 之一。值可以是任何已知的浏览器。

示例:

Mozilla/5.0(Macintosh;Intel Mac OS X 10_12_6)AppleWebKit/537.36(KHTML,如 Gecko)Chrome/63.0.3239.132 Safari/537.36

关于python - Web 抓取导致 403 禁止错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48756326/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com