gpt4 book ai didi

java - JSOUP 重复的 html 表

转载 作者:行者123 更新时间:2023-12-01 09:35:33 25 4
gpt4 key购买 nike

我想使用库JSOUP过滤html表格。它过滤完美,但会创建一些重复的表。

这是我的语法:

  • doc1 是一个文档
  • content 是带有 html 文档的 String
  • tabelletotali 是文档数组
<小时/>
doc1 = Jsoup.parseBodyFragment(content);
tabelletotali = doc1.getElementsByTag("table");
<小时/>

tabelletotali中包含所有表,但有冗余。

怎么了?

最佳答案

您当前使用的方法 - getElementsByTag() - 递归查找并选择具有指定标签名称的所有元素。如果您只需要选择父级表而不选择嵌套表,请使用带有 > 选择器的 select() 方法:

Document doc = Jsoup.parseBodyFragment(html);
Elements e = doc.select("body > table");

这仅选择直接从父元素下降的子元素(例如本例中的 body),这意味着嵌套表不会被选择两次。

关于java - JSOUP 重复的 html 表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38980392/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com