gpt4 book ai didi

javascript - 请求 HTML 获取通过 AJAX 加载的 HTML 主体

转载 作者:行者123 更新时间:2023-12-03 08:58:24 27 4
gpt4 key购买 nike

嗨,我目前正在构建一个基于网络爬虫的程序。目前我遇到了障碍,因为对我的 html 请求的响应只给了我一些内容。其余内容加载在我的浏览器中,但在调用 request(url, cb) 时不会出现。

我的猜测是,这部分 html 代码是通过 angularjs 之类的东西加载的,因为我的浏览器显示了所有丢失的内容(并且您可以看到丢失的内容是在页面之后加载的)。

我该如何解决这个问题?有没有办法在添加所有元素后获取 html?

谢谢

最佳答案

你是对的。仅使用请求来获取 HTML,您将无法看到使用所有 JavaScript 渲染后的页面外观。我会看看 phantomjs 或基于 phantomjs 的框架,例如 http://nrabinowitz.github.io/pjscrape/ 。这将允许您在执行客户端 JavaScript 后访问 HTML。

关于javascript - 请求 HTML 获取通过 AJAX 加载的 HTML 主体,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32393791/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com