gpt4 book ai didi

java - 抢强标签Jsoup后的号码

转载 作者:行者123 更新时间:2023-12-01 09:03:43 26 4
gpt4 key购买 nike

  <td style="padding-left: 5px; padding-right: 5px; padding-top: 1px; padding-bottom: 1px; border: none;">
<strong>test:</strong> 62
</td>

<td style="padding-left: 5px; padding-right: 5px; padding-top: 1px; padding-bottom: 1px; border: none;">
<a style="color: inherit;" href="redacted">
<strong>test:</strong> 51
</a>
</td>

<td style="padding-left: 5px; padding-right: 5px; padding-top: 1px; padding-bottom: 1px; border: none;">
<a style="color: inherit;" href="redacted">
<strongtest:</strong> 11
</a>
</td>

我想抓取每个强标签后面的数字。我想我可以做 doc.select("strong ~ *") 但这给了我空。

我也尝试过元素强 = document.select("strong").first();//这不应该是强标记之后或之间的第一个元素吗?

在结束标记之后选择的答案是什么。

最佳答案

您要查找的数字不在强标签之间。它们要么位于 td 标签内,要么位于 a 标签内,而 a 标签本身又位于 td 标签内。您可以通过选择 td 标签并检查 td 是否有自己的文本来获取数字;如果是,那就是你的号码,否则获取 td 的第一个子元素,即 a 标签并获取其自己的文本。示例:

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class JsoupTest {
public static void main(String argv[]){
String html = "<table>"+
" <td style=\"padding-left: 5px; padding-right: 5px; padding-top: 1px; padding-bottom: 1px; border: none;\">" +
" <strong>test:</strong> 62" +
" </td>" +
" <td style=\"padding-left: 5px; padding-right: 5px; padding-top: 1px; padding-bottom: 1px; border: none;\">" +
" <a style=\"color: inherit;\" href=\"redacted\">" +
" <strong>test:</strong> 51" +
" </a>" +
" </td>" +
" <td style=\"padding-left: 5px; padding-right: 5px; padding-top: 1px; padding-bottom: 1px; border: none;\">" +
" <a style=\"color: inherit;\" href=\"redacted\">" +
" <strong>test:</strong> 11" +
" </a>" +
" </td>";
Document doc = Jsoup.parse(html);
Elements tds = doc.select("td");
for(Element e : tds){
if (!e.ownText().isEmpty()){
System.out.println(e.ownText());
}
else{
System.out.println(e.child(0).ownText());
}
}
}
}

关于java - 抢强标签Jsoup后的号码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41458684/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com