gpt4 book ai didi

python - 使用 BeautifulSoup 根据同级内容抓取值

转载 作者:行者123 更新时间:2023-12-01 03:21:32 25 4
gpt4 key购买 nike

假设我有一个 HTML 格式的代码:

...
<div class="class1">
<div class="subclass1">Text1</div>
<div class="subclass2">Text2</div>
</div>
<div class="class1">
<div class="subclass1">Text3</div>
<div class="subclass2">Text4</div>
</div>
<div class="class1">
<div class="subclass1">Text5</div>
<div class="subclass2">Text6</div>
</div>
...

如何根据Text1提取Text2?

我有几个想法,但都包含带有循环的复杂结构以及列表和 bs Series 之间的转换。有什么想法吗?

最佳答案

text2 = soup.find('div', text='Text1').find_next('div').text
# |-----find div tag-------|-get next div tag-|

输出:

'Text2'

或者:

soup.find('div', text='Text1').next_sibling.next_element.text

不推荐这样做

关于python - 使用 BeautifulSoup 根据同级内容抓取值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41871006/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com