gpt4 book ai didi

python - Web 从表格中抓取数据

转载 作者:太空宇宙 更新时间:2023-11-04 10:15:02 25 4
gpt4 key购买 nike

我想抓取本页的年损益表、 Assets 负债表和现金流量表。 https://www.google.com/finance?q=NYSE%3AIBM&fstype=ii&ei 并将其放入数据框中。如您所见,您可以通过单击页面的不同部分来更改数据。谁能告诉我如何刮掉年度损益表?这是我到目前为止所拥有的。我可以看到汤中的数据,但我不知道如何获取它。

from bs4 import BeautifulSoup
import requests
import pandas as pd

df =pd.DataFrame()
url = 'https://www.google.com/finance?q=NYSE%3AIBM&fstype=ii&ei'
headers = {'User-Agent': 'Mozilla/5.0 (Windows; Windows NT 6.1) AppleWebKit/536.5 (KHTML, like Gecko) Chrome/19.0.1084.46 Safari/536.5'}
r = requests.get(url,headers=headers)
soup = BeautifulSoup(r.text,'html.parser')

最佳答案

你为什么不直接使用 pandas 的 read_html() 函数呢?结果,您将获得一个数据框列表 (df),每个表格一个,可以通过单击选项(其中包括年度损益表)显示:

import pandas as pd
df = pd.read_html("https://www.google.com/finance?q=NYSE%3AIBM&fstype=ii&ei")

关于python - Web 从表格中抓取数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35863312/

25 4 0
文章推荐: php - 我想要