gpt4 book ai didi

java - 抓取本地存储的 HTML 文件的数据

转载 作者:太空宇宙 更新时间:2023-11-04 12:46:11 25 4
gpt4 key购买 nike

我的 HTML 看起来像这样:

    <table  cellspacing='0' border='0' width='100%'>
<col align='left' />
<tr>
<td align='left'><font color='#FF0000'>Programming</font></td>
</tr>
</table>
<table cellspacing='0' border='0' width='100%'>
<col align='left' />
<col align='right' />
<tr>
<td align='left'><font color='#000000'>A1000</font></td>
<td align='right'><font color='#008000'>D.Rogers</font></td>
</tr>
</table>

它是本地存储的。我试图弄清楚如何抓取“Programming”、“A1000”和“D.Rogers”的数据。我如何使用 Java 和 Jsoup 来做到这一点?

最佳答案

基于帖子中的示例:

String localHtml=" <table cellspacing=\'0\' border=\'0\' width=\'100%\'>\n"+
" <col align=\'left\' />\n"+
" <tr>\n"+
" <td align=\'left\'><font color=\'#FF0000\'>Programming</font></td>\n"+
" </tr>\n"+
" </table>\n"+
" <table cellspacing=\'0\' border=\'0\' width=\'100%\'>\n"+
" <col align=\'left\' />\n"+
" <col align=\'right\' />\n"+
" <tr>\n"+
" <td align=\'left\'><font color=\'#000000\'>A1000</font></td>\n"+
" <td align=\'right\'><font color=\'#008000\'>D.Rogers</font></td>\n"+
" </tr>\n"+
" </table>";

Document doc = Jsoup.parse(localHtml);

System.out.println(doc.select("font[color=#FF0000]").text());
System.out.println(doc.select("font[color=#000000]").text());
System.out.println(doc.select("font[color=#008000]").text());

输出

Programming
A1000
D.Rogers

关于java - 抓取本地存储的 HTML 文件的数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36303495/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com