gpt4 book ai didi

java - 使用 jSoup 解析最里面的 html 标签

转载 作者:行者123 更新时间:2023-12-01 05:08:30 25 4
gpt4 key购买 nike

这是我的代码。

String tags="<html><head></head><body><table><tr><td>1</td></tr><tr><td><table><tr><td>3</td><td>4</td></tr></table></td></tr></table><body></html>";
Document document = Jsoup.parse(tags);
for(int i=0;i<document.body().childNodes().size();i++)
{
if(!document.body().childNodes().get(i).nodeName().startsWith("#"))
{
System.out.println("1st Level Nodes:"+document.body().childNodes().get(i).nodeName());
while(document.body().childNodes().get(i).childNodes().size()>1)
{
System.out.println("2nd Level: "+document.body().childNodes().get(i).childNodes().get(0).nodeName());
}
}
}

如何解析逐个标签返回的 HTML。循环不覆盖最里面的标签。

这是一个格式良好的 html 代码。解析所有标签到最里面。

<html>
<head></head>
<body>
<table>
<tr>
<td>1</td>
</tr>

<tr>
<td>
<table>
<tr>
<td>3</td>
<td>4</td>
</tr>
</table>
</td>
</tr>
</table>
<body>
</html>

我想将标签之间的所有 html 作为我在 html 代码中显示的 html 层次结构获取。所以我喜欢按照父级和子级的顺序依次获取所有标签。

最佳答案

如果您只需要标签,可以在此处使用:

String tags = "<html><head></head><body><table><tr><td>1</td></tr><tr><td><table><tr><td>3</td><td>4</td></tr></table></td></tr></table><body></html>";
Document doc = Jsoup.parse(tags);


for( Element e : doc.select("*") // you can use 'doc.getAllElements()' here too
{
System.out.println(e.tag());
}

输出:

#root
html
head
body
table
tbody
tr
td
tr
td
table
tbody
tr
td
td

关于java - 使用 jSoup 解析最里面的 html 标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12388111/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com