gpt4 book ai didi

java - 有没有一个库可以通过 AJAX/javascript 艰难地进行?

转载 作者:行者123 更新时间:2023-12-02 07:44:42 24 4
gpt4 key购买 nike

我正在使用 PHP 从网页上抓取一些信息,但是,我发现我试图从页面上抓取的信息是通过某种 AJAX/javascript 方式加载的。我以为我记得 Curl 可以迭代 javascript,但我发现事实并非如此。

我似乎记得某种后端“网络浏览器”库/功能,可以通过 javascript 和 AJAX 进行跟踪,以获得全功能浏览器将到达的最终页面结果。

是否有库或函数可以做到这一点?除了必须自己手动跟踪脚本/重定向之外,还有关于如何解决此问题的任何想法吗?它不必很漂亮——我只是想抓取结果文本。

最佳答案

也许不是在 php 中,但在其他语言中有:Watir/WatiN、selenium、watir/selenium-webdriver、capybara-webkit、celerity、node.js 直接运行 js,以及 phantomjs。还有 iMacros 和类似的商业选项。

但我通常发现,只需查看页面发出的请求并重新创建它们/解析响应,我就可以获得我想要的数据,而无需任何这些。

关于java - 有没有一个库可以通过 AJAX/javascript 艰难地进行?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11072604/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com