gpt4 book ai didi

python - 使用 BeautifulSoup 中的 nextSibling 什么都不输出

转载 作者:太空狗 更新时间:2023-10-30 01:03:44 26 4
gpt4 key购买 nike

我正在尝试在以下方面使用 BeautifulSoup:

<h4>Hello<br /></h4>
<p><img src="http://url.goes.here" alt="hiya" class="img" />May 28, 1996</p>

对于这个例子,假设我有 <h4>标签保存在变量tag .当我输入 print tag.text输出是 Hello , 正如预期的那样。

但是,当我使用 print tag.nextSibling输出什么都没有。当我输入 print tag.nextSibling.nextSibling , 输出为 <p><img src="http://url.goes.here" alt="hiya" class="img" />May 28, 1996</p> .到底是怎么回事?为什么我必须加倍使用 .nextSibling<p>在我的示例中标记?这始终是一个错误。

最佳答案

显然,.nextSibling 抓取白色文本。所以在我正在使用的实际页面中,<h4> 之间有白色文本。和 <p>标签,这就是为什么我必须加倍。

证据

写作:

print tag.__class__
print tag.nextSibling.__class__
print tag.nextSibling.nextSibling.__class__

产量:

<class 'BeautifulSoup.Tag'>
<class 'BeautifulSoup.NavigableString'>
<class 'BeautifulSoup.Tag'>

关于python - 使用 BeautifulSoup 中的 nextSibling 什么都不输出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5690686/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com