gpt4 book ai didi

python - xpath 表达式仅获取动态内容节点的文本内容

转载 作者:行者123 更新时间:2023-12-01 05:02:05 25 4
gpt4 key购买 nike

我正在 try catch <div class="num"> 的内容以下 HTML 代码中没有子元素:

<div class="num">
<del>14,490</del>
13,490
</div>

所以我期待13,490结果。

我使用以下 xpath 表达式:

//div[@class="num"]/node()[not(self::del)]

对于这个例子来说效果很好,但问题是 div 的内容可能会有所不同,有时它不包含子元素。

我正在使用 Python,可以在编码级别处理这个问题,但我很好奇这是否只能通过 xpath 来完成。

最佳答案

您只需获取text():

//div[@class="num"]/text()

演示(使用 xmllint ):

$ xmllint index.html --xpath '//div[@class="num"]/node()[not(self::del)]'
13,490
$ xmllint index.html --xpath '//div[@class="num"]/text()'
13,490

如果没有 del 标签,这也可以工作:

<div class="num">
13,490
</div>

关于python - xpath 表达式仅获取动态内容节点的文本内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25876758/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com