gpt4 book ai didi

javascript - PHP 服务器上的 HTML 数据挖掘

转载 作者:行者123 更新时间:2023-12-03 10:01:55 30 4
gpt4 key购买 nike

我使用 jQuery 创建了一个不错的库,它在浏览器中运行,基本上完成了从各种 html 页面中挖掘任意数据的任务。我想将此库迁移到运行 PHP 的 Apache 服务器并在服务器端运行它。但是,我不知道与 PHP 兼容的可靠浏览器模拟器。最坏的情况是用 PHP 再次实现整个事情。该解决方案将涉及:

  • 发送请求
  • 解析 HTML
  • 实现基本功能来执行之前由 Javascript/jQuery 标准执行的任务
  • 从头开始实现 PHP 库

但是,这只是最坏情况的一部分。另一部分是一些页面在客户端执行进一步的操作,然后向服务器发送请求。这意味着在某些情况下,初始页面加载不包含部分数据。

就我而言,最好有一个服务器端浏览器模拟器,它可以加载页面并接受 JavaScript 命令并返回响应。这个领域是否有一些技术,或者我应该考虑从头开始实现一切?

最佳答案

您应该尝试 PhantomJS ( http://phantomjs.org ),这是“控制台中”的 WebKit 引擎,可以安装在您的服务器上。 CaperJS ( http://casperjs.org/ ) 也可能有用。

关于javascript - PHP 服务器上的 HTML 数据挖掘,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30558002/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com