gpt4 book ai didi

python lxml : how to get text from a element which has a child element

转载 作者:太空宇宙 更新时间:2023-11-03 16:05:38 24 4
gpt4 key购买 nike

我想从 html 代码中提取一些文本,但以下内容不可行返回一些文本,而不是返回“\n”。那么如何获得一些测试呢?

a=html.fromstring("""
<p class="clearfix">
<i class="xueli"></i>
sometext
</p>
""")
a.find(".//i").getparent().text

最佳答案

使用 text_content() 方法代替 .text:

In [5]: a.find(".//i").getparent().text_content().strip()
Out[5]: 'sometext'

或者,您可以获取 i 元素的以下同级文本:

In [6]: a.xpath(".//i/following-sibling::text()")[0].strip()
Out[6]: 'sometext'

关于python lxml : how to get text from a element which has a child element,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39832587/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com