gpt4 book ai didi

java - HTMLDocument 迭代器跳过标签

转载 作者:行者123 更新时间:2023-12-01 05:05:04 27 4
gpt4 key购买 nike

我正在使用 HTMLDocument 迭代器来尝试迭代 HTMLDocument 中的所有 a 标记。然而,迭代器似乎跳过了嵌套在 p 标签内的 a 标签。例如:

<html>
<body>
<a href = "somesite"> some site </a>
<p>
<a href = "someothersite"> some other site </a>
</p>
</body>
</html>

迭代器将获取第一个 a 标记(某个站点),但不会转到 p 标记内的 a 标记(某个其他站点)。

代码如下:

private void getLinks() throws MalformedURLException {
HTMLDocument.Iterator it = content.getIterator(HTML.Tag.A);
it.next();
while(it.isValid()) {
// Do something
it.next();
}
}

有人可以提出原因吗?

最佳答案

也许 isValid() 检查会破坏您的循环。尝试迭代器是否在没有该检查的情况下命中第二个 anchor 标记。

关于java - HTMLDocument 迭代器跳过标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12834331/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com