gpt4 book ai didi

javascript - 如何从远程 URL 获取特定的 HTML 内容?

转载 作者:行者123 更新时间:2023-11-28 16:27:22 25 4
gpt4 key购买 nike

我想从远程网站 url 获取特定的 HTML 内容。
网站网址如下,
http://www.realtor.com/realestateandhomes-detail/10216-Montwood-Drive_El-Paso_TX_79925_M78337-06548

我想从上面的网站网址获取一些特定信息。在这里,我附加了图像,它突出显示了我想要的所有突出显示部分的特定区域,其中有标题、图像和描述。 enter image description here


如何使用 JQuery 或 Javascript 或 Json 调用获取内容?还有其他方法可以得到这些吗?

最佳答案

您可能有兴趣查看 pjscrape (免责声明:这是我的项目)。这是一个使用 PhantomJS 的命令行工具允许在完整的浏览器上下文中使用 JavaScript 和 jQuery 进行抓取。

  • 抓取器可以直接用 Javascript 编写,并在您正在抓取的网站的上下文中执行,使用非常简单、jQuery 友好的语法。
  • 它可以抓取单个页面、页面数组,或者您可以定义一个函数来查找更多 URL 以在每个页面上进行抓取。
  • 它支持 JSON 和 CSV 输出,无论是到文件还是到 STDOUT

如果网站是静态的并且结构是统一的,那么将您需要的所有内容抓取到结构化数据格式中应该非常快。

关于javascript - 如何从远程 URL 获取特定的 HTML 内容?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7527775/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com