gpt4 book ai didi

python - 使用 Xpath (HtmlXPathSelector) 获取父文本和子文本

转载 作者:太空宇宙 更新时间:2023-11-04 14:20:03 25 4
gpt4 key购买 nike

我正在抓取一个网站,我需要从这个 HTML 文档中获取数值:

<td>
<span style=" color: red; font-weight: bold;"> 1.950</span>
</td>
<td> 3.400</td>

我需要同时提取 1.950 和 3.400,但当一个值仅在 a 中但另一个值也有跨度时,我不知道该怎么做。有没有一种通用的方法来获得路径的父项和子项?我将 scrapy 框架与 HtmlXPathSelector 一起使用。我可以将路径 /td/text() 用于一个,将 /td/span/text() 用于另一个,但我需要在一个查询中完成.如何实现?

最佳答案

您可以尝试使用:/td//text() 来选择作为 td

后代的每个文本节点

关于python - 使用 Xpath (HtmlXPathSelector) 获取父文本和子文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14299100/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com