gpt4 book ai didi

python - 使用 Python 和 Selenium 进行网页抓取,不知道如何获取动态数据

转载 作者:行者123 更新时间:2023-11-28 02:39:03 25 4
gpt4 key购买 nike

我正在尝试从表中获取值,但它们不在 HTML 中。但是,当我在浏览器中检查它们时,它们 在 HTML 中。我猜它们是动态生成的,但我如何在 Selenium 或 Python 中以其他方式捕获它们?

最佳答案

你可以这样做

from selenium import webdriver
import pandas as pd
import time

driver = webdriver.Chrome()
driver.get('https://www.predictit.org/Contract/7422/Will-Trump-veto-Russian-sanctions-bill-by-August-31#prices')

time.sleep(2)
tables = pd.read_html(driver.page_source) # returns list of dataframes
print(len(tables))
print(tables[2]) # this is table with YES
print(tables[3]) # this is the table with NO

此代码仅获取表格,但您需要进行一些清理。您可以阅读 pandas.DataFrame 的文档

关于python - 使用 Python 和 Selenium 进行网页抓取,不知道如何获取动态数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45453183/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com