gpt4 book ai didi

html - XPath 选择该父 div 内的
的所有文本内容排除特定的
标记

转载 作者:行者123 更新时间:2023-11-28 01:42:44 25 4
gpt4 key购买 nike

我正在查询的部分 HTML:

<div class="author">   
Tobi Raphael
<div class="artdate"> Last Updated: 24 July 2014|16:25 GMT</div>
</div>

我只需要“Tobi Raphael”。我不要<div class"artdate"元素。

我试过下面的 XPath 表达式但没有用:

[@class='author']/*/descendant-or-self::*[text() and not(self::div)]

我的查询有什么问题?

最佳答案

您应该从根或所选元素开始。

假装我们在根

/div[@class='author']/text()

这会将所有文本放入您的元素中,包括空文本如空格、制表符等...:

Text='Tobi Raphael'
Text=''

如果我们想避免这种情况

/div[@class='author']/text()[normalize-space(.) != '']

仅输出文本:

Text='Tobi Raphael'

关于html - XPath 选择该父 div 内的 <div> 的所有文本内容排除特定的 <div> 标记,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24953258/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com