gpt4 book ai didi

python - 使用 ElementTree 删除父标签(不删除子标签)

转载 作者:行者123 更新时间:2023-12-04 04:55:38 25 4
gpt4 key购买 nike

我正在使用 ElementTree修改以下 xml:

<li>
<p>Some stuff goes in <b>bold</b> here </p>
</li>

我想删除所有 <p>来 self 的 <li>元素,但保留内容。

像这样:

<li>Some stuff goes in <b>bold</b> here</li>

我目前正在使用以下代码,它适用于简单的情况(没有文本/尾部等......):

# strip <p> from <li> elements
liElements = rootNode.findall('.//li')
for elem in liElements:
para = elem.find(".//p")
for child in para:
elem.append(child)
elem.text = para.text
elem.remove(para)

必须有一种更简单的方法来去除格式标签....我希望?

最佳答案

也许最简单的方法是使用 ElementTree 来处理 HTML,而是使用 BeautifulSoup反而;该库通过 .unwrap() method 显式处理解包:

for elem in soup.find_all('li'):
for para in elem.find_all('p'):
para.unwrap()

关于python - 使用 ElementTree 删除父标签(不删除子标签),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16779922/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com