gpt4 book ai didi

java - 使用java从网页中提取HTML内容

转载 作者:行者123 更新时间:2023-11-27 22:40:26 26 4
gpt4 key购买 nike

我正在尝试使用 JAVA 提取网页的 HTML 内容。但问题是我试图加载的页面在用户向下滚动时会不断扩展。所以我的代码只能提取页面第一次加载的内容。我如何提取通常在用户向下滚动时生成的 HTML 代码的剩余部分。

最佳答案

打开 firebug 或 chrome 开发者工具。查看网络选项卡。当您向下滚动时,将进行 ajax 调用。请注意此 url 和参数。您将不得不手动调用适当的 url(ajax url)并解析可能是 html 也可能不是 html 的响应。

关于java - 使用java从网页中提取HTML内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11230900/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com