> M-6ren">
gpt4 book ai didi

python - BeautifulSoup - 无需类即可获取 h2 文本

转载 作者:太空宇宙 更新时间:2023-11-03 16:42:44 28 4
gpt4 key购买 nike

我的代码:

<div id="title">
<h2>
My title <span class="subtitle">My Subtitle</span></h2></div>

如果我使用此代码:

title = soup.find('div', id="title").h2.text
print title
>> My title My Subtitle

它匹配一切。我想将我的标题和我的副标题匹配为 2 个不同的对象:

print title 
>> My title
print subtitle
>> My subtitle

有什么帮助吗?

最佳答案

你可以得到副标题,它是preceding sibling分别:

title = soup.find('div', id="title").h2
subtitle = title.find(class_="subtitle")
print(subtitle.previous_sibling.strip(), subtitle.get_text())

或者,您可以以非递归方式定位文本节点:

title = soup.find('div', id="title").h2
print(title.find(text=True, recursive=False).strip(),
title.find(class_="subtitle").get_text(strip=True))

两者都打印:

(u'My title', u'My Subtitle')

关于python - BeautifulSoup - 无需类即可获取 h2 文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36651256/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com