gpt4 book ai didi

java - 使用htmlunit提取html内容

转载 作者:行者123 更新时间:2023-12-01 15:48:31 24 4
gpt4 key购买 nike

我有一系列具有相同结构的 HTML 文件。

让我们看一下这个示例代码。

>     <html>
> <head>
> <title>main page</title>
> </head>
> <body>
> <table><tr>
> <td>content1</td>
> </tr></table>
> </body>
> </html>

我想提取title标签内容和td标签内容。如何使用 htmlunit 来做到这一点?我是 htmlunit 的新手。请帮助我。

最佳答案

查看此instructive snippet来自 HTMLUnit 页面。

在那里,您首先构建一个客户端,然后检索您的页面,最后请求标题文本 (page.getTitleText()),或者以 HTML 字符串形式获取整个页面 ( page.asXml())。然后您可以对该字符串进行 assertContains

还有很多其他选项,例如通过 id 检索元素。最好亲自查看示例。

关于java - 使用htmlunit提取html内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6619821/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com