gpt4 book ai didi

java - 如何在Java中使用正则表达式提取HTML 标签数据?

转载 作者:行者123 更新时间:2023-12-01 18:00:49 25 4
gpt4 key购买 nike

我尝试使用 Java 从电子邮件中读取用户名和密码它以 html 格式返回邮件内容,我只想提取 <td> 下的用户名和密码。标签。下面是我的 HTML 代码片段 -

<table width="200">
<tbody>
<tr>
<td colspan="2">Your Account Details:</td>
</tr>
<tr>
<td>EmailId:</td>
<td><a class="moz-txt-link-abbreviated" href="mailto:jainish.m.kapadia@trimantra.net">jainish.m.kapadia@trimantra.net</a></td>
</tr>
<tr>
<td>Password:</td>
<td>C3mRXh+|n#1J</td>
</tr>
</tbody>
</table>

如何实现这一目标?

最佳答案

请不要尝试使用 RegEx 解析 HTML,有关为什么您不应该尝试此操作的详细答案,请参阅此 SO answer .

您可以使用jsoup用于解析 HTML 字符串,如下所示:

String html = "<html><head><title>First parse</title></head>"
+ "<body><p>Parsed HTML into a doc.</p></body></html>";
Document doc = Jsoup.parse(html);

Element content = doc.getElementById("content");
Elements links = content.getElementsByTag("a");
for (Element link : links) {
String linkHref = link.attr("href");
String linkText = link.text();
}

jsoup 还提供了分层导航的方法,例如

siblingElements();
nextElementSibling();

等等。

关于java - 如何在Java中使用正则表达式提取HTML <td>标签数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41116508/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com