gpt4 book ai didi

python - 美汤刮一 table

转载 作者:太空宇宙 更新时间:2023-11-04 05:03:12 24 4
gpt4 key购买 nike

我正在尝试从该网站抓取价格表(购买是,价格和契约(Contract)可用):https://www.predictit.org/Contract/7069/Will-the-Senate-pass-the-Better-Care-Reconciliation-Act-by-July-31#prices .

这是我的(显然是非常初步的)代码,现在结构化只是为了找到表格:

from bs4 import BeautifulSoup
import requests
from lxml import html
import json, re

url = "https://www.predictit.org/Contract/7069/Will-the-Senate-pass-the-Better-Care-Reconciliation-Act-by-July-31#prices"

ret = requests.get(url).text

soup = BeautifulSoup(ret, "lxml")

try:
table = soup.find('table')
print table
except AttributeError as e:
print 'No tables found, exiting'

代码查找并解析一个表;然而,它是错误的(不同选项卡上的数据表 https://www.predictit.org/Contract/7069/Will-the-Senate-pass-the-Better-Care-Reconciliation-Act-by-July-31#data )。

如何解决此错误以确保代码识别正确的表?

最佳答案

正如@downshift 在评论中提到的,该表是使用 xhr 请求生成的 js。
因此,您可以使用 Selenium 或直接请求网站的 api。

使用第二个选项:

url = "https://www.predictit.org/PrivateData/GetPriceListAjax?contractId=7069"
ret = requests.get(url).text
soup = BeautifulSoup(ret, "lxml")
table = soup.find('table')

关于python - 美汤刮一 table ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45178001/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com