gpt4 book ai didi

java - jsoup:解析特定标签之后的特定标签的数据

转载 作者:太空宇宙 更新时间:2023-11-04 11:31:13 25 4
gpt4 key购买 nike

最近3天我试图通过Java中的jsoup解析某些信息-_-,这是我的代码:

Document document = Jsoup.connect(urlofpage).get();
Elements links = document.select(".contentBox");

for (Element link : links) {
// String name = link.text();
String title = link.select("h2").text();
String content = link.select("p").text();
System.out.println(title);
System.out.println(content);
}

它是按照指示获取数据,分别获取h2和p的数据,但问题是,我想解析<p>里面的数据紧接着每个 <h2> 的标签标签。

例如(HTML 内容):

<h2>main content</h2>
<div class="acx"><div>
<p>content</p>
<p>content 2</p>

<h2>content 2</h2>
<div class="acx"><div>
<p>new content od 2</p>
<p>new 2</p>

现在它应该像(在数组中)一样获取:

array[0] = "content content 2",
array[1] = "new content od 2 new 2",

有什么解决办法吗?

最佳答案

您可以使用“~”下一个元素选择器。例如

link.select("h2 ~ p").get(0).text(); // returns "content"
link.select("h2 ~ p").get(1).text(); // returns "new content od 2"

关于java - jsoup:解析特定标签之后的特定标签的数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43768180/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com