gpt4 book ai didi

java - Jsoup/Java - 如何提取不在标签内的数据

转载 作者:行者123 更新时间:2023-11-27 23:59:59 25 4
gpt4 key购买 nike

我必须像这样解析 HTML

<span class="legenda">Cargo a que concorre:</span> Vereador<br />
<span class="legenda">Nome para urna:</span> Adeilza<br />
<span class="legenda">Número:</span> 40656<br />
<span class="legenda">Estado:</span> Amapá<br />
<span class="legenda">Município:</span> Vitória do Jari<br />
<span class="legenda">Partido:</span> Partido Socialista Brasileiro - PSB<br />
<span class="legenda">Coligação:</span> Vitória para todos (PSB / PV / PRTB)<br />

我正在使用 jsoup 来解析和遵循示例,但我不知道在这种情况下如何获取值。例如“Verreador”或“Adeilza”。有办法用 jsoup 做到这一点吗?

这里是链接,如果有人想看所有的html页面。查看源代码:http://www.eleicoes2012.info/adeilza-psb-40656/

最佳答案

在 jSoup Element 上调用 nextSibling 将为您提供它找到的下一个 Node。在这种情况下,您可以为具有 legenda 类的 span 元素使用选择器,然后调用 nextSibling。快速示例:

Document doc = Jsoup.connect("http://www.eleicoes2012.info/adeilza-psb-40656/").get();
Elements spans = doc.select("span.legenda");

for(Element span: spans) {
System.out.println(span.nextSibling());
}

为我生成了这个输出:

Adeilza Ribeiro de Souza
30 anos (09/08/1983)
Almeirim/PA
Solteiro(A)
Dona de Casa
Ensino Fundamental Incompleto

0 Votos
Vereador
Adeilza
40656
Amap&aacute;
Vit&oacute;ria do Jari
Partido Socialista Brasileiro - PSB
Vit&oacute;ria para todos (PSB / PV / PRTB)

关于java - Jsoup/Java - 如何提取不在标签内的数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21806768/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com