gpt4 book ai didi

ruby - 如何以编程方式获取已爬网网页的快照(在 Ruby 中)?

转载 作者:数据小太阳 更新时间:2023-10-29 08:19:23 24 4
gpt4 key购买 nike

以编程方式拍摄网页快照的最佳解决方案是什么?

情况是这样的:我想抓取一堆网页并定期拍摄它们的缩略图快照,比如每隔几个月一次,而不必手动访问每个网页。我还希望能够拍摄可能完全是 Flash/Flex 的网站的 jpg/png 快照,因此我必须等到它加载后才能以某种方式拍摄快照。

如果我可以生成的缩略图数量没有限制(在合理范围内,比如每天 1000 个),那就太好了。

知道如何在 Ruby 中执行此操作吗?看起来很艰难。

在以下浏览器中执行此操作:Safari 或 Firefox,最好是 Safari。

非常感谢。

最佳答案

这实际上取决于您的操作系统。您需要的是一种连接到网络浏览器并将其保存为图像的方法。

如果您使用的是 Mac - 我想您最好的选择是使用 MacRuby (或 RubyCocoa - 虽然我相信这将在不久的将来被弃用)然后使用 WebKit 框架加载页面并将其呈现为图像。

这绝对是可能的,您不妨看看Paparazzi!以获得灵感。和 webkit2png项目。

另一个不依赖于操作系统的选项可能是使用 BrowserShots API .

关于ruby - 如何以编程方式获取已爬网网页的快照(在 Ruby 中)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1632836/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com