gpt4 book ai didi

python - beautifulsoup:找到第 n 个元素兄弟

转载 作者:太空狗 更新时间:2023-10-29 20:55:03 25 4
gpt4 key购买 nike

我有一个具有以下性质的复杂 html DOM 树:

<table>
...
<tr>
<td>
...
</td>
<td>
<table>
<tr>
<td>
<!-- inner most table -->
<table>
...
</table>

<h2>This is hell!</h2>
<td>
</tr>
</table>
</td>
</tr>
</table>

我有一些逻辑可以找出最里面的表。但是在找到它之后,我需要获取下一个兄弟元素 (h2)。无论如何你可以做到这一点?

最佳答案

如果tag是最内层的表,那么

tag.findNextSibling('h2')

会是

<h2>This is hell!</h2>

要真正获得下一个 sibling ,您可以使用 tag.nextSibling,在本例中,它是 u'\n'

如果你想要下一个不是 NavigableString 的兄弟(比如 u'\n'),那么你可以使用

tag.findNextSibling(text=None)

如果你想要第二个 sibling (不管它是什么),你可以使用

tag.nextSibling.nextSibling

(但请注意,如果 tag 没有下一个兄弟,则 tag.nextSibling 将为 None,并且 tag .nextSibling.nextSibling 将引发 AttributeError。)

关于python - beautifulsoup:找到第 n 个元素兄弟,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2613527/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com