gpt4 book ai didi

python - Scrapy提取非包装数据

转载 作者:行者123 更新时间:2023-12-01 03:20:06 25 4
gpt4 key购买 nike

我正在尝试使用 scrapy 提取特定的价格数据,但价格未包含在标签中。

我如何从这个 html 中编写价格?

<div class="value">
<span class="currency">€</span>
39
<span class="decimal">.98</span>
<span class="type">New</span>
</div>

如何将其优化为 39,98?

使用的解决方案:

"".join(response.xpath("//section[@class='order order--new order--left']//div[@class='spec  price']//div[@class='value']//text()").re("[0-9.]+"))

最佳答案

获取元素内所有文本节点并加入:

$ scrapy shell file://$PWD/index.html
In [1]: "".join(response.xpath("//div[@class = 'value']//text()").re("[0-9.]+"))
Out[1]: u'39.98'

.re() 仅有助于过滤数字和点。

如果文档中有多个值:

In [2]: ["".join(value.xpath(".//text()").re(r"[0-9.]+")) for value in response.xpath("//div[@class = 'value']")]
Out[2]: [u'39.98']

关于python - Scrapy提取非包装数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42006621/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com