gpt4 book ai didi

java - 在jsoup中提取td标签内的href值

转载 作者:搜寻专家 更新时间:2023-11-01 01:28:12 24 4
gpt4 key购买 nike

我有

<table class="table" >
<tr>
<td><a href="url">text1</a></td>
<td>text2</td>

</tr>
<tr>
<td><a href="url2">text</a></td>
<td>text</td>

</tr>

我想提取所有行的 url 和文本我用

Document doc = Jsoup.connect(url).get();
for (Element table : doc.select("table.table")) {
for (Element row : table.select("tr")) {
Elements tds = row.select("td");
String text1=tds.get(0).text();
String url= row.attr("href");
System.out.println(text1+ "," + url);
}
}

我得到了 text1 值,但 url 为空。

如何从 td 标签中获取 url?

最佳答案

您的行变量不是a 标签,因此上面没有属性href

试试这个:

Element table = doc.select("table.table");
Elements links = table.getElementsByTag("a");
for (Element link: links) {
String url = link.attr("href");
String text = link.text();
System.out.println(text + ", " + url);
}

这几乎是从 JSoup documentation 中提取的

关于java - 在jsoup中提取td标签内的href值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11045930/

24 4 0