gpt4 book ai didi

java - 使用 Java 的 XPath - 在子标签之间选择文本值

转载 作者:数据小太阳 更新时间:2023-10-29 02:09:24 25 4
gpt4 key购买 nike

我正在处理这个 html 片段:

<p class="pageSelector">
<a href="/BlaBla">&lt; Prev</a>&nbsp;
<a href="/BlaBla">1</a>&nbsp;
<a href="/BlaBla">2</a>&nbsp;
<a href="/BlaBla">3</a>&nbsp;
4&nbsp;
<a href="/BlaBla">5</a>&nbsp;
<a href="/BlaBla">6</a>&nbsp;
<a href="/BlaBla">Next &gt;</a>&nbsp;
</p>

呈现(或多或少)为 4 5 6 Next >

我想选择“4”,因为我需要发现“当前”页面。使用

//p[@class='pageSelector']/text()[normalize-space()]

(使用 Firefox XPath Ckecker 测试)我以为我已经解决了但没有,因为我获得了 7 个匹配项。

谁能告诉我哪里错了?谢谢

最佳答案

normalize-space 删除空格,但出于此目的,不间断空格字符(尽管它的视觉外观)不被视为空格。所以我会做

text()[translate(., '&#x20;&#x09;&#x0a;&#x0d;&#xa0;', '')]

它将返回那些包含除空格或无间断字符以外的字符的子文本节点;然后您可能需要进一步处理以提取您想要的部分内容。

关于java - 使用 Java 的 XPath - 在子标签之间选择文本值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5001704/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com