gpt4 book ai didi

javascript - 使用 Ruby 爬取 Javascript 繁重的网站

转载 作者:行者123 更新时间:2023-11-30 17:45:58 25 4
gpt4 key购买 nike

我想抓取一些严重依赖 Javascript 的网站,而我的 Mechanize 代理(我通常使用的代理)无法处理这些网站,因为它无法呈现 html。一个很好的例子是 this site .

有没有什么方法可以从 Ruby on Rails 应用程序中获取该站点的渲染 html 输出?

我正在使用 Ruby 2.0.0 和 Rails 4.0.1

最佳答案

您可以使用 Capybara去做吧。这是一个资源:

或在 Google 中搜索“Capybara”抓取工具。

需要注意的一点是,性能会很糟糕。我已经建立了这样一个刮板,它几乎不值得。

关于javascript - 使用 Ruby 爬取 Javascript 繁重的网站,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20168789/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com