gpt4 book ai didi

java - 如何在 HtmlUnit 中将 HtmlPage 转换为 Html 字符串

转载 作者:太空宇宙 更新时间:2023-11-04 07:15:32 27 4
gpt4 key购买 nike

我想将页面转换为真正的 HTML 字符串,其中 <html> , <body>等等...,而不是 XML。我只看到asXml()函数,它经常改变结构中的许多东西。

另请注意,我在获取页面后对其进行了修改,并且我希望这些修改也出现在输出中。

我怎样才能做到这一点?非常感谢。

最佳答案

所以让我检查一下我是否正确:

  1. 您提取了一个页面
  2. 您对页面进行了修改(例如:修改其中的节点)
  3. 您需要一个有效的 HTML 页面,其中包含以前的修改(作为字符串)

page.asXml() 不会有帮助。这将以字符串形式返回有效的 XML 文件,而不是有效的 HTML 文件。

page.getWebResponse().getContentAsString() 也无济于事。这将返回服务器给您的响应(不进行任何修改)。

没有其他方法可以返回包含有效 HTML 字符串的字符串。

但是,您可以尝试使用page.save(file)。这会将修改后的页面保存为 HTML 文件。遗憾的是,我认为没有一种方法可以接收 OutputStream,因此您很可能必须将文件保存到文件系统,然后将其取回。

也许,您可以查看 HTMLUnit 源代码并了解该方法是如何实现的。也许添加您自己的 save 方法并不那么复杂:)

关于java - 如何在 HtmlUnit 中将 HtmlPage 转换为 Html 字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20028501/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com