gpt4 book ai didi

python-2.7 - 构造Xpath

转载 作者:行者123 更新时间:2023-12-03 17:04:21 26 4
gpt4 key购买 nike

我有以下重复的网页内容:

<div class="txt ext">
<strong class="param">param_value1</strong>
<strong class="param">param_value2</strong>
</div>


我想使用Xpath分别提取值 param_value1param_value2。我该怎么做?

我尝试了以下构造:

'//strong[@class="param"]/text()[0]'
'//strong[@class="txt ext"]/strong[@class="param"][0]/text()'
'//strong[@class="param"]'


没有一个人分别将 param_value1param_value2退还给我。

附言我正在使用Python 2.7和最新版本的Scrapy。

最佳答案

这是我的测试代码:

test_content = '<div class="txt ext"><strong class="param">param_value1</strong><strong class="param">param_value2</strong></div>'

sel = HtmlXPathSelector(text=test_content)
sel.select('//div/strong[@class="param"]/text()').extract()[0]
sel.select('//div/strong[@class="param"]/text()').extract()[1]

关于python-2.7 - 构造Xpath,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23417345/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com