gpt4 book ai didi

python - 我如何使用 lxml , python 解析 html

转载 作者:太空宇宙 更新时间:2023-11-04 07:25:15 25 4
gpt4 key购买 nike

我有一些 html 文件:

<html>
<body>
<span class="text">One</span>some text1</br>
<span class="cyrillic">Мир</span>some text2</br>
</body>
</html>

如何在 python 中使用 lxml 获取“some text1”和“some text2”?

最佳答案

import lxml.html

doc = lxml.html.document_fromstring("""<html>
<body>
<span class="text">One</span>some text1</br>
<span class="cyrillic">Мир</span>some text2</br>
</body>
</html>
""")

txt1 = doc.xpath('/html/body/span[@class="text"]/following-sibling::text()[1]')
txt2 = doc.xpath('/html/body/span[@class="cyrillic"]/following-sibling::text()[1]')

关于python - 我如何使用 lxml , python 解析 html,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4180887/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com