gpt4 book ai didi

python - 在 Python 中使用某些文本抓取 HTML 表格

转载 作者:行者123 更新时间:2023-11-27 23:01:11 26 4
gpt4 key购买 nike

我正在尝试使用 python 网络抓取 HTML 表格。 HTML 页面中有很多表格,但我只想抓取某个表格。我正在使用漂亮的汤来做这个网页抓取。

我的代码是这样的:

page = get("http://uobgoldprice.com/history/2018/September/10/")
html = BeautifulSoup(page.content, 'html.parser')

for p in html.select('tr'):
if p.text == "ARGOR CAST BAR":
print (p.text)

我只想要“截至 2018 年 9 月 10 日星期一的汇率”的表格。

我该怎么做?

最佳答案

您需要找到包含文本的元素和作为表格的父元素:

import re
import requests
from bs4 import BeautifulSoup

page = requests.get("http://uobgoldprice.com/history/2018/September/10/")
html = BeautifulSoup(page.content, 'html.parser')

element = html.find(text=re.compile('Rate as at Monday, 10 September 2018'))
print(element.findParent('table'))

关于python - 在 Python 中使用某些文本抓取 HTML 表格,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52336057/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com