gpt4 book ai didi

python - 使用 xpath 提取表列值(不包括 )

转载 作者:行者123 更新时间:2023-12-01 08:43:07 24 4
gpt4 key购买 nike

我正在尝试使用 scrapy 废弃一些表列值,并停留在如何获取列值上。现在的代码是

response.xpath('//table//tr//td[4]//text()').extract()

它确实提取了列值,但问题是某些列确实有

<td> value 1 <sup> sup text </sup> </td> 

返回值为 value1 , sup text这不是我所需要的。我只需要尝试使用 td[4][not(sup)] 的代码但它确实完全忽略了 <sup> 的列。

有没有办法获取不包括 <sup> 的值.

最佳答案

你需要

//td[4]/text()

获取子文本节点。请注意,//td[4]//text() - 返回后代文本节点(包括来自sup的文本)

关于python - 使用 xpath 提取表列值(不包括 <sup>),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53423227/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com