gpt4 book ai didi

java - 从 html 页面中提取元素的最佳方法?

转载 作者:行者123 更新时间:2023-11-28 04:15:13 25 4
gpt4 key购买 nike

用 Java 从 HTML 页面中提取元素的首选方法是什么?

我的 HTML 包含以下许多行:

<tr class="item-odd">
<td class="data"><a href="http://.....">TITLE</a></td>
<td><div class="cost">$1.99</div></td>
</tr>

该类交替使用 item-odditem-even。

我需要提取:

  1. 网址
  2. 职位
  3. 价格

正则表达式是正确的选择吗?

最佳答案

我会使用像 HTML Parser 这样的库为了这份工作。看看 samples和/或 javadoc .也看看 previous questions在这里。

HTML Parser非常易于使用,应该可以胜任。对于替代方案,请查看此 previous answer .

关于java - 从 html 页面中提取元素的最佳方法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2016959/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com