gpt4 book ai didi

java - 使用 jsoup 获取表的内容

转载 作者:行者123 更新时间:2023-11-29 04:58:03 26 4
gpt4 key购买 nike

我正在尝试使用 jsoup 将 URL(表:- 内容)的内容抓取到数组列表中。到目前为止,在网上搜索与我类似的问题时遇到了死胡同。也许新鲜的眼睛会有所帮助。这是我到目前为止所拥有的,并不多。我在某处读到我需要识别表 ID,然后使用 Elements 循环遍历每一行的标签,如果是真的如何?

try {               
Document doc = Jsoup.connect("http://www.us-proxy.org").userAgent("Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.101 Safari/537.36").get();
//utilize the fetched html
} catch(Exception e{
e.printStackTrace();
}

这是我的 URL html 站点(相关部分)的输出源:-

<table cellpadding="0" cellspacing="0" border="0" class="display fpltable" id="proxylisttable">
<thead>
<tr>
<th>IP Address</th>
<th>Port</th>
<th>Code</th>
<th>Country</th>
<th>Anonymity</th>
<th>Google</th>
<th>Https</th>
<th>Last Checked</th>
</tr>
</thead>
<tbody>
<tr><td>24.210.34.226</td><td>3128</td><td>US</td><td>United States</td><td>transparent</td><td>no</td><td>no</td><td>18 hours 20 minutes ago</td></tr>
<tr><td>50.76.49.97</td><td>4444</td><td>US</td><td>United States</td><td>transparent</td><td>no</td><td>no</td><td>18 hours 20 minutes ago</td></tr>
<tr><td>
</tbody>
<tfoot>
<tr>
<th class="input"><input type="text" /></th>
<th></th>
<th></th>
<th></th>
<th></th>
<th></th>
<th></th>
<th></th>
</tr>
</tfoot>
</table>

我想要的输出应该类似于这个代理:50.76.49.97 端口:4444 国家:美国类型:透明......

有什么帮助吗?

最佳答案

    Elements elements = doc.select("table[class=display fpltable]");

Elements rows = elements.get(0).select("tr");

for (Element row : rows) {

if (row.select("td").size() == 8) {
String iPAddress = row.select("td").get(0).text();
String port = row.select("td").get(1).text();
String code = row.select("td").get(2).text();
String country = row.select("td").get(3).text();
String anonymity = row.select("td").get(4).text();
String google = row.select("td").get(5).text();
String https = row.select("td").get(6).text();
String lastChecked = row.select("td").get(7).text();
}

}

关于java - 使用 jsoup 获取表的内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33038770/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com