gpt4 book ai didi

java - 如何删除除某些特定元素之外的所有 HTML body 元素

转载 作者:太空宇宙 更新时间:2023-11-04 11:47:47 26 4
gpt4 key购买 nike

我的文件夹中有一个 HTML 文件列表。我从文件夹中获取了所有 HTML 文件,并使用 jsoup 对于每个 html 页面获取了 HTML 文档元素。

现在我必须删除每个 HTML 页面中除两个 div 元素之外的所有 Html body 元素。我如何实现这一目标?

最佳答案

解决方案可能如下所示:

Elements bodyChildElements = doc.body().children();

for(Element e : bodyChildElements){
if(!e.tagName().equals("div")){
e.remove();
}
else if(!e.attr("id").equals("abc") && !e.attr("id").equals("xyz")){
e.remove();
}
}
System.out.println(doc.html());

这将获取 body 下面的所有元素并将它们从文档中删除,除非它们是具有特定 id 属性值的 div。

关于java - 如何删除除某些特定元素之外的所有 HTML body 元素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42160519/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com