gpt4 book ai didi

java - 获取htmlunit中td元素的值

转载 作者:行者123 更新时间:2023-12-01 09:12:36 24 4
gpt4 key购买 nike

<td>
<span>hi</span>
<a>re</a>
hello
</td>
我的 DOM 元素结构如上所示。使用 htmlunit,我只想提取值“hello”,因为我有 HtmlElement 对象引用“td”节点。我尝试使用 getTextContent(),但它返回“hirehello”,这是我不想要的。

最佳答案

查看文档,getTextContent明确表示它返回元素 及其后代的文本,并且我没有看到任何其他方法仅返回文本节点的总和,所以我认为您需要一个循环。例如,假设 element 引用 td 元素:

StringBuffer sb = new StringBuffer(/*some appropriate size*/);
for (DomNode n : element.getChildNodes()) {
if (n.getNodeType() == Node.TEXT_NODE) {
sb.append(n.getTextContent());
}
}
String text = sb.toString();

请注意,您引用的结构中的文本节点的总和只是“hello”,它之前和之后都有空格。如果您只想要“hello”,则需要将其修剪掉。

关于java - 获取htmlunit中td元素的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40827739/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com