gpt4 book ai didi

python - 在 beautifulsoup4 中具有子元素的标签内提取文本节点

转载 作者:太空狗 更新时间:2023-10-30 00:14:12 25 4
gpt4 key购买 nike

我正在解析和抓取的 HTML 具有以下代码:

<li> <span> 929</span> Serve Returned </li>

如何只提取 <li> 的文本节点? ,在这种情况下“返回服务”为Beautifulsoup

.string<li> 起无效有一个子元素,并且 .text返回 <span> 中的文本.

最佳答案

import bs4
html = r"<li> <span> 929</span> Serve Returned </li>"
soup = bs4.BeautifulSoup(html)
print soup.li.findAll(text=True, recursive=False)

这给出:

[u' ', u' Serve Returned ']

第一个元素是跨度之前的“文本”。此方法可以帮助您在任何子元素之前和之后(以及之间)找到文本。

关于python - 在 beautifulsoup4 中具有子元素的标签内提取文本节点,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29808016/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com