gpt4 book ai didi

javascript - 如何使用 python 从带有 javascript 的网页中获取表格内容?

转载 作者:行者123 更新时间:2023-12-02 23:52:07 24 4
gpt4 key购买 nike

我喜欢从中获取表格内容page 。以下是我的代码,我得到 NaN (没有数据)。怎么数字不显示?如何抓取对应数据的表?谢谢。

enter image description here

最佳答案

您可以从 api 获取漂亮的 json 格式:

import requests
import pandas as pd

url = 'https://api.blockchain.info/stats'

headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
params = {'cors': 'true'}

data = requests.get(url, headers=headers, params=params).json()

# if you want it as a table
df = pd.DataFrame(data.items())

选项 2:

让页面完全呈现。有更好的方法将 wait 与 Selenium 一起使用,但只需快速插入 5 秒等待即可显示:

from selenium import webdriver
import pandas as pd
import time

url = 'https://www.blockchain.com/stats'


browser = webdriver.Chrome('C:/chromedriver_win32/chromedriver.exe')
browser.get(url)
time.sleep(5)

dfs = pd.read_html(browser.page_source)
print(dfs[0])

browser.close()

输出:

                    0                   1                   2   3
0 Blocks Mined 150 150 NaN
1 Time Between Blocks 9.05 minutes 9.05 minutes NaN
2 Bitcoins Mined 1,875.00000000 BTC 1,875.00000000 BTC NaN

关于javascript - 如何使用 python 从带有 javascript 的网页中获取表格内容?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55595919/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com