gpt4 book ai didi

java html解析器不读取所有页面

转载 作者:行者123 更新时间:2023-12-01 16:01:01 25 4
gpt4 key购买 nike

我正在解析html页面以获取特定信息,但有些页面我无法获取网页上显示的所有信息,例如this page

我无法获取评论信息。顺便说一下,如果你看页面的源代码,会发现有很多空行,并且没有出现评论信息。

你知道为什么吗?有哪些库可以读取这种类型的页面?

谢谢

最佳答案

我敢打赌他们正在使用某种 JavaScript 来加载评论信息。为了访问该信息,您需要以某种方式模拟请求或评估 javascript,然后解析结果页面。我建议检查他们的 javascript 并模仿他们用于下载评论信息的请求,因为这比尝试评估代码中的 javascript 容易得多。

关于java html解析器不读取所有页面,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3927508/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com