gpt4 book ai didi

web-scraping - 使用 XPath 抓取不包含某个子元素的元素

转载 作者:行者123 更新时间:2023-12-05 04:39:55 31 4
gpt4 key购买 nike

对于抓取工具,我希望获得页面上所有元素的列表,其中不包含某个子元素。 DOM 看起来像这样

<scrape>
<div id='123'>
<span>test</span>
</div>
</scrape>
<scrape>
<div id='1234'>
<span>test</span>
</div>
</scrape>
<scrape>
<div id='12345'>
<span>test</span>
<span>don't include</span>
</div>
</scrape>

我需要做的是,我的列表需要包含所有 scrape 元素,这些元素不包含文本不包含的跨度。

有什么想法吗?

谢谢!

最佳答案

这应该可行

//scrape[not(.//span[text()='don't include'])]

字面意思:
标签名称 scrape 的元素(子元素)带有 span 标签名称和 text具有值不包括

关于web-scraping - 使用 XPath 抓取不包含某个子元素的元素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/70370729/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com