gpt4 book ai didi

python - 如何使用scrapy选择下一个节点

转载 作者:太空狗 更新时间:2023-10-29 13:09:00 25 4
gpt4 key购买 nike

我的 html 看起来像这样:

<h1>Text 1</h1>
<div>Some info</div>
<h1>Text 2</h1>
<div>...</div>

我了解如何使用 scrapy 信息从 h1 中提取:

content.select("//h1[contains(text(),'Text 1')]/text()").extract()

但我的目标是从<div>Some info</div>中提取内容

我的问题是我没有关于 div 的任何具体信息。据我所知,它正好在 <h1>Text 1</h1> 之后.我可以使用选择器在树中获取 NEXT 元素吗?元素,位于 DOM 树中的同一层?

类似于:

a = content.select("//h1[contains(text(),'Text 1')]/text()")
a.next("//div/text()").extract()
Some info

最佳答案

试试这个xpath:

//h1[contains(text(), 'Text 1')]/following-sibling::div[1]/text()

关于python - 如何使用scrapy选择下一个节点,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19767517/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com