gpt4 book ai didi

python - 匹配 HTML 中的特定表格,BeautifulSoup

转载 作者:行者123 更新时间:2023-11-28 22:56:19 25 4
gpt4 key购买 nike

我有这个问题。我试图抓取的页面上有几个类似的表格。

<h2 class="tabellen_ueberschrift al">Points</h2>
<div class="fl" style="width:49%;">
<table class="tabelle_grafik lh" cellpadding="2" cellspacing="1">

它们之间的唯一区别是 h2 标签内的文本,这里是:Points

如何指定我需要在哪个表中搜索?

我有这段代码,需要调整 h2 标签因子:

my_tab = soup.find('table', {'class':'tabelle_grafik lh'})

需要一些帮助。

最佳答案

这对我有用。找到“previousSiblings”,如果您在具有不同文本内容的 h2 标记之前找到带有文本“Points”的 h2,那么您找到了一个很好的表格

from BeautifulSoup import BeautifulSoup

t="""
<h2 class="tabellen_ueberschrift al">Points</h2>
<table class="tabelle_grafik lh" cellpadding="2" cellspacing="1">
<th><td>yes me!</th></td></table>
<h2 class="tabellen_ueberschrift al">Bad</h2>
<table class="tabelle_grafik lh" cellpadding="2" cellspacing="1">
<th><td>woo woo</td></th></table>
"""

soup = BeautifulSoup(t)

for ta in soup.findAll('table'):
for s in ta.findPreviousSiblings():
if s.name == u'h2':
if s.text == u'Points':
print ta
else:
break;

关于python - 匹配 HTML 中的特定表格,BeautifulSoup,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15866297/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com