gpt4 book ai didi

python - 如何删除 BeautifulSoup 中的空格

转载 作者:太空狗 更新时间:2023-10-29 21:14:51 26 4
gpt4 key购买 nike

我有一堆 HTML 正在使用 BeautifulSoup 进行解析,除了一个小问题外,它一直运行良好。我想将输出保存到单行字符串中,并将以下内容作为我当前的输出:

    <li><span class="plaincharacterwrap break">
Zazzafooky but one two three!
</span></li>
<li><span class="plaincharacterwrap break">
Zazzafooky2
</span></li>
<li><span class="plaincharacterwrap break">
Zazzafooky3
</span></li>

理想情况下我会喜欢

<li><span class="plaincharacterwrap break">Zazzafooky but one two three!</span></li><li><span class="plaincharacterwrap break">Zazzafooky2</span></li>

我想去掉很多多余的空格,但使用 strip() 不一定能删除它,我也不能公然删除所有空格,因为我需要保留文本。我该怎么做?正则表达式的杀伤力似乎是一个很常见的问题,但这是唯一的方法吗?

我没有任何 <pre>标签,这样我就可以在那里更有力一些。

再次感谢!

最佳答案

下面是不用正则表达式的方法:

>>> html = """    <li><span class="plaincharacterwrap break">
... Zazzafooky but one two three!
... </span></li>
... <li><span class="plaincharacterwrap break">
... Zazzafooky2
... </span></li>
... <li><span class="plaincharacterwrap break">
... Zazzafooky3
... </span></li>
... """
>>> html = "".join(line.strip() for line in html.split("\n"))
>>> html
'<li><span class="plaincharacterwrap break">Zazzafooky but one two three!</span></li><li><span class="plaincharacterwrap break">Zazzafooky2</span></li><li><span class="plaincharacterwrap break">Zazzafooky3</span></li>'

关于python - 如何删除 BeautifulSoup 中的空格,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4270742/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com