gpt4 book ai didi

java - 用汤提取数据

转载 作者:行者123 更新时间:2023-12-01 12:05:40 26 4
gpt4 key购买 nike

我正在使用 jsoup 从网络中提取信息,我的代码如下:

doc = Jsoup.connect(myurl).get();
Elements newsHeadlines = doc.select(".myclass");

如果我对 newsHeadlines 执行 System.out.println,我会得到:

<span class="cmtComentario">
<span class="blaicon"></span>
<span class="blacoment"><span class="cmtHora" data-hora=""></span>
<span class="blathing" data-minutoPartido="93'"></span>
<span class="blado"></span>
<span class="blahave">
Oh yeah!<br/></span>
</span>
</span>
<span class="cmtComentario">
<span class="blaicon"></span>
<span class="blacoment"><span class="cmtHora" data-hora=""></span>
<span class="blathing" data-health="97'"></span>
<span class="blado"></span>
<span class="blahave">
This is my world</span>
</span>
</span>

如何将每个 block 保存在数组中:

<span class="cmtComentario">
<span class="blaicon"></span>
<span class="blacoment"><span class="cmtHora" data-hora=""></span>
<span class="blathing" data-health="92'"></span>
<span class="blado"></span>
<span class="blahave">
This is my world</span>
</span>
</span>

非常感谢

最佳答案

newsHeadlines 只不过是 Element 的列表如Elements实现列表。

因此,您可以像迭代列表一样迭代 newsHeadlines

for(Element element : newsHeadlines) {
System.out.println(element.toString());
}

如果这不是您需要的(我没有测试代码),您可以尝试 Element.children 。这再次为您提供了可以迭代的元素。

关于java - 用汤提取数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27638996/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com