gpt4 book ai didi

python - XPath:删除空格功能不起作用

转载 作者:行者123 更新时间:2023-11-28 20:47:51 26 4
gpt4 key购买 nike

我正在使用 Scrapy、XPath 和 Python 来抓取网站。当我得到结果时,它有\r\n。谷歌搜索表明我需要在我的 XPath 上使用 normalize-space() 。当我这样做时,见下文,它不起作用。

item ['runs'] = stats.select((normalize-space('//tr[@class="cell1"]/td[3]/text()')[count])).extract()

我收到“全局名称规范化未定义错误”。

有什么想法吗?

最佳答案

normalize-space 是 XPath 的一部分,而不是 Python。所以在 Python 或其他一些库中没有这样的功能。它的正确用法是这样的(仅供示例):

stats.select('''//tr[normalize-space(td/text()) = 'User Name']''').extract()

只是为了在 python 中删除字符串的空格,您可以使用 str 方法。例如:strip 将删除前导和尾随空格。

>>> '\r\n\rsample\r\n'.strip()
'sample'

类似normalize-space的东西:

>>> ' '.join('\r\ns  am  \r\n ple\r\n'.split())
's am ple'

关于python - XPath:删除空格功能不起作用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18071987/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com