gpt4 book ai didi

python - BeautifulSoup 连续 block

转载 作者:太空宇宙 更新时间:2023-11-03 17:48:01 26 4
gpt4 key购买 nike

我正在使用BeautifulSoup来解析我爬行的html数据,我正在查看的模式是

<div>
....
</div>
<p>
...
</p>

我关心的内容总是用 div 括起来,后跟 p 子句。当然,html 中还有其他独立的 divp 标记,但是 p 后面跟着 div是我想要的独特图案

非常感谢帮助了解如何在 beautifulSoup 中实现查询连续标签

最佳答案

有相关.next_sibling , .next_siblings , .find_next_sibling() and .find_next_siblings()可以帮助您找到 divp 同级的方法:

div = soup.find("div", id="test")
p = div.find_next_sibling("p")

您还可以使用"adjacent" CSS selector :

soup.select("div#test + p")

关于python - BeautifulSoup 连续 block ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29503197/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com