gpt4 book ai didi

python - 在Python中使用BeautifulSoup解析多个段落

转载 作者:行者123 更新时间:2023-11-30 23:34:05 24 4
gpt4 key购买 nike

我想在Python中使用BeautifulSoup从这样的html中解析html

<p><b>Background</b><br />x0</p><p>x1</p>
<p><b>Innovation</b><br />x2</p><p>x3</p><p>x4</p>
<p><b>Activities</b><br />x5</p><p>x6</p>"

对于这个结果:

Background: x0, x1
Innovation: x2, x3, x4
Activities: x5, x6

我厌倦了使用下面的 python 脚本:

from bs4 import BeautifulSoup
htmltext = "<p><b>Background</b><br />x0</p><p>x1</p>
<p><b>Innovation</b><br />x2</p><p>x3</p><p>x4</p>
<p><b>Activities</b><br />x5</p><p>x6</p>"
html = BeautifulSoup(htmltext)
for n in html.find_all('b'):
title_name = n.next_element
title_content = n.nextSibling.nextSibling
print title_name, title_content

但是,我只能得到这个:

Background: x0
Innovation: x2
Activities: x5

欢迎您提出意见,我们将不胜感激您的建议。

最佳答案

<p><b>Innovation</b><br />x2</p><p>x3</p><p>x4</p>您将前往 <b>元素和定位x2思想next_element 。这一切都很好。但要定位x3x4您需要首先在元素层次结构中上升到封闭的 <p>元素并从那里找到以下 <p>附上x3x4 .

关于python - 在Python中使用BeautifulSoup解析多个段落,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18408799/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com