gpt4 book ai didi

java - 如何用java获取网页的源代码?(如何处理延迟加载?)

转载 作者:行者123 更新时间:2023-11-28 03:37:15 25 4
gpt4 key购买 nike

我想获取整个网页的源代码,但是网站的某些内容一开始没有加载。(似乎与Ajax有关)如何获取这些没有用java一次加载的内容?

我尝试使用 java 的 url.openStrem。但这没有用。我只得到内容“loading...”,而不是加载后的真实内容。

非常感谢。

最佳答案

您需要远程控制现有浏览器(使用 Java 并不容易,因为大多数使用其他语言/组件系统/界面)或使用可以执行 Javascript 的 headless 浏览器。 HTMLUnit属于后一类。

关于java - 如何用java获取网页的源代码?(如何处理延迟加载?),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13470689/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com