gpt4 book ai didi

python - Beautiful Soup,按标签内容搜索,里面有标签

转载 作者:可可西里 更新时间:2023-11-01 13:33:24 26 4
gpt4 key购买 nike

<th rowspan="3" style="background:#c0cfe4; width:7em">present</th>
<td>ich <a href="/wiki/mache" title="mache">mache</a></td>
<td>wir <strong class="selflink">machen</strong></td>
<th rowspan="3" style="background:#c0cfe4; width:7em">i</th>
<td>ich <a href="/wiki/mache" title="mache">mache</a></td>
<td>wir <strong class="selflink">machen</strong></td>
</tr>
<tr>
<td>du <a href="/wiki/machst" title="machst">machst</a></td>
<td>ihr <a href="/wiki/macht" title="macht">macht</a></td>
<td>du <a href="/wiki/machest" title="machest">machest</a></td>
<td>ihr <a href="/wiki/machet" title="machet">machet</a></td>
</tr>
<th colspan="6" style="background:#9999DF">future i</th>
</tr>
<tr>
<th rowspan="3" style="background:#ccccff">infinitive</th>
<td rowspan="3" colspan="2">machen werden</td>
<th rowspan="3" style="background:#ccccff">subjunctive i</th>
<td>ich werde machen</td>
<td>wir werden machen</td>
</tr>
<tr>
<td>du werdest machen</td>
<td>ihr werdet machen</td>
</tr>
<tr>
<td>er werde machen</td>
<td>sie werden machen</td>
</tr>

我正在尝试提取 <td>du <a href="/wiki/machst" title="machst">machst</a></td>在第 9 行。当我使用 soup.find_all("td" text="re.compile("^du)) 执行搜索时我得到的只是第 24 行的标签。执行此操作的正确方法是什么?

最佳答案

作为替代方法,您将获得 next td 有一个 textdu 开头:

print next(td for td in soup.find_all("td") if td.text.startswith('du')) 

此外,您还可以 pass a functionfind_all() :

def td_with_du(tag):
return tag.name == 'td' and tag.text.startswith('du')

print soup.find_all(td_with_du)

演示:

>>> from bs4 import BeautifulSoup
>>> data = """
Your HTML code goes here
"""
>>> soup = BeautifulSoup(data)
>>> def td_with_du(tag):
... return tag.name == 'td' and tag.text.startswith('du')
...
>>> for td in soup.find_all(td_with_du):
... print td.text
...
du machst
du machest
du werdest machen

关于python - Beautiful Soup,按标签内容搜索,里面有标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23813694/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com