gpt4 book ai didi

python - 使用 BeautifulSoup 提取包含字符串的表

转载 作者:行者123 更新时间:2023-12-01 05:43:21 25 4
gpt4 key购买 nike

我正在尝试使用 BeautifulSoup 解析一个网站,该网站包含表中表中的许多表等。具体来说,我正在查看 websites of this form 。我想提取相关的表格,例如那些比赛统计数据,但似乎无法找到提取相关表格的方法,因为它们不包含诸如特定类别等的区别特征。

有没有办法提取包含某些字符串的表?

最佳答案

您可以提取包含字符串的表,例如:

for tag in soup.find_all(text=re.compile('Sydney Match Statistics')):
print tag.findParent('table').findParent('table')

这会找到包含文本“Sydney Match Statistics”的元素,然后找到包含该文本的,然后找到包含该文本的另一个

.parent.next_sibling 方法似乎对于您的情况也很有用,可以在找到包含相关字符串的元素后导航到正确的元素。

关于python - 使用 BeautifulSoup 提取包含字符串的表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16880005/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com