gpt4 book ai didi

python - Scrapy Xpath 根据容器中带有文本的标签获取文本

转载 作者:行者123 更新时间:2023-12-01 02:27:24 25 4
gpt4 key购买 nike

我有这个代码:

<div class="col-md-12">
<strong>Ingredients:</strong> TOMATOES (TOMATOES AND FIRE ROASTED TOMATOES, TOMATO JUICE, CITRIC ACID, CALCIUM CHLORIDE), WHITE WINE VINEGAR, CARROTS. <span style="font-style:italic">Date Available</span>: 07/14/2017&nbsp;&nbsp; <span style="font-style:italic">Date Last Updated by Company</span>: 07/14/2017
</div>

我想要提取的是使用 Scrapy 和 Xpath 的成分列表。唯一的标识结构是包含

的 div
<strong>Ingredients:</strong>

但我不知道如何根据这些规则提取成分。

最佳答案

您要查找的文本可以被识别为 strong 元素的直接同级,它会转换为以下 XPath 表达式:

query = "//div/strong[.='Ingredients:']/following-sibling::text()[1]"

如果没有谓词[1],查询也会返回“可用日期”和“上次更新日期”。

关于python - Scrapy Xpath 根据容器中带有文本的标签获取文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47239510/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com