gpt4 book ai didi

java - 如何查找所有子节点的文本

转载 作者:行者123 更新时间:2023-11-29 06:00:06 26 4
gpt4 key购买 nike

我正在使用 webdriver 来抓取网站以寻找装饰有魔术常量的链接,除了文本可能被格式化:

<a href="blah" ..><span blah>magic</span></a>

还有很多层次

<a href="blah" ..><span blah>A <span blah><b>magic</b></span> evening</span></a>

我不知道它是否被格式化,或者如果是,它深入了多少层,因为我正在搜索任意站点。

我的代码看起来像这样:

List<WebDriver> links = driver.getElements(By.tagName("a"));
for (WebElement link : links) {
List<WebElement> children = link.getElements(By.tagName("*"));
for (WebElement child : children) {
if (myPattern.matcher(child.getText()).matches()) {
System.out.println("found match!");
}
}
}

但这无法找到匹配项。

关于如何确定是否存在匹配的任何想法?

最佳答案

如果您可以使用 XPath,一个有用的 XPath 表达式是:

//a[span[.//text()[. = 'magic']]]

这会选择 XML 文档中的所有 a,这些 aspan 子级具有文本节点后代,其字符串值为字符串 "magic"

关于java - 如何查找所有子节点的文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10477414/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com