gpt4 book ai didi

python - HTTP 错误 403 : Forbidden when reading HTML

转载 作者:太空狗 更新时间:2023-10-29 22:06:21 25 4
gpt4 key购买 nike

我想阅读下面的 html,

 import pandas as pd

daily_info=pd.read_html('https://www.investing.com/earnings-calendar/',flavor='html5lib')

print(daily_info)

不幸出现:

urllib.error.HTTPError: HTTP Error 403: Forbidden

有办法解决吗?

最佳答案

假装成浏览器:

import requests

url = 'https://www.investing.com/earnings-calendar/'

header = {
"User-Agent": "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.75 Safari/537.36",
"X-Requested-With": "XMLHttpRequest"
}

r = requests.get(url, headers=header)

dfs = pd.read_html(r.text)

结果:

In [201]: len(dfs)
Out[201]: 7

In [202]: dfs[0]
Out[202]:
0 1 2 3
0 NaN NaN NaN NaN

In [203]: dfs[1]
Out[203]:
Unnamed: 0 Company EPS /  Forecast Revenue /  Forecast.1 Market Cap Time \
0 Monday, April 24, 2017 NaN NaN NaN NaN NaN NaN NaN
1 NaN Acadia (AKR) -- / 0.11 -- / -- 2.63B NaN
2 NaN Agree (ADC) -- / 0.39 -- / -- 1.34B NaN
3 NaN Alcoa (AA) -- / 0.53 -- / -- 5.84B NaN
4 NaN American Campus (ACC) -- / 0.27 -- / -- 6.62B NaN
5 NaN Ameriprise Financial (AMP) -- / 2.52 -- / -- 19.76B NaN
6 NaN Avacta Group (AVTG) -- / -- 1.26M / -- 47.53M NaN
7 NaN Bank of Hawaii (BOH) 1.2 / 1.08 165.8M / -- 3.48B NaN
8 NaN Bank of Marin (BMRC) 0.74 / 0.8 -- / -- 422.29M NaN
9 NaN Banner (BANR) -- / 0.68 -- / -- 1.82B NaN
10 NaN Barrick Gold (ABX) -- / 0.2 -- / -- 22.44B NaN
11 NaN Barrick Gold (ABX) -- / 0.28 -- / -- 30.28B NaN
12 NaN Berkshire Hills Bancorp (BHLB) -- / 0.54 -- / -- 1.25B NaN
13 NaN Brookfield Canada Office Properties (BOXC) -- / -- -- / -- NaN NaN

...

关于python - HTTP 错误 403 : Forbidden when reading HTML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43590153/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com