html - 如何在 Ruby 脚本中备份整个网页(包括图像等)？-6ren

html - 如何在 Ruby 脚本中备份整个网页(包括图像等)？

转载作者：数据小太阳更新时间：2023-10-29 08:28:59

26

4

如果我有一个网页的 URL，如何将它下载到本地，包括所有的图像、样式表等？我是否必须手动解析 HTML 并找出所有外部资源？或者有更清洁的方法吗？

谢谢!

最佳答案

这是我去别处寻找的那些时候之一。并不是说它不能在 Ruby 中完成，而是有其他现成的工具可以很好地完成这项工作。为什么要重新发明轮子？

看wget .它是用于检索 Web 资源(包括镜像站点)的标准工具，可在所有平台上使用。来自 the docs :

Retrieve only one html page, but make sure that all the elements needed for the page to be displayed, such as inline images and external style sheets, are also downloaded. Also make sure the downloaded page references the downloaded links.

wget -p --convert-links http://www.server.com/dir/page.html

The html page will be saved to www.server.com/dir/page.html, and the images, stylesheets, etc., somewhere under www.server.com/, depending on where they were on the remote server.

您可以使用反引号或 %x 在 Ruby 脚本中轻松调用 wget:

`/path/to/wget -p --convert-links http://www.server.com/dir/page.html`

或

%x{/path/to/wget -p --convert-links http://www.server.com/dir/page.html}

在 Ruby 中有很多其他机制可以做同样的事情，让您有更多的控制权。

关于html - 如何在 Ruby 脚本中备份整个网页(包括图像等)？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/6720952/

26

4

0

文章推荐： MySQL 数据映射器适配器正在链接查询而不是加入

文章推荐： ruby-on-rails - 如何在 Controller 中构建嵌套表单的子项

文章推荐： ruby - Rhomobile 和 Appcelerator 是直接竞争对手吗？

文章推荐： ruby - DL 文件名中带有括号的 Ruby Open-URI 文件

Mercurial 备份
如何启用 Mercurial(中央/主)存储库的自动(增量)备份？我来自颠覆，在那里我能够制作一个提交 Hook ，将更改上传到 S3。编辑: 如果这种策略对 Mercurial 没有意义，那么什
backup - 备份/镜像Github存储库
我想定期创建我的github存储库的备份。是否有一种快速的方法可以在不知道整个列表的情况下将它们全部拉出？沃尔特最佳答案您可以通过GitHub的API获取整个列表： curl http://gi
Django flatpages 备份？
我正在使用 flatpages在我在本地服务器上开发的站点中。我需要备份平面页面的数据以在最终服务器中使用它。有谁知道怎么做？最佳答案在您的本地服务器上运行: python manage.py d
Azure 备份，应用程序设置中的连接字符串是否会导致现有应用程序出现问题？
我们已将应用服务升级到 S1，并希望设置自动备份。这是一个带有 SQL 数据库的 .net core 应用程序。对于数据库部分，我得到以下内容: No supported connection str
Azure Blob 备份
我们使用一些阻止 blob 来存储一些持久资源，然后用于存储事件数据的页面 blob 我们需要备份 blob，因此我尝试使用 AzCopy。它在我的开发机器上工作正常，但在其他慢速机器上失败，并出
Hadoop HDFS 备份
关闭。这个问题需要更多 focused .它目前不接受答案。想改进这个问题？更新问题，使其仅关注一个问题 editing this post . 5年前关闭。 Improve this questi
docker redis 备份
我正在看这个例子 docker run --rm --volumes-from myredis -v $(pwd)/backup:/backup debian cp /data/dump.rdb /b
Azure Blob 备份
我们使用一些阻止 blob 来存储一些持久资源，然后用于存储事件数据的页面 blob 我们需要备份 blob，因此我尝试使用 AzCopy。它在我的开发机器上工作正常，但在其他慢速机器上失败，并出
java - 备份 Java？
我目前正在使用 Java，并且正在寻找一个程序，该程序可以在每次编译时保存我正在执行的操作的新版本。我不介意它是否不运行，我可以进去编辑类名，使其与 .java 名称匹配。由于我是一个初学者，我总是因
backup - RabbitMQ 备份
在 RabbitMQ 管理控制台中，出于导入和导出目的，我在概览页面底部看到了导入/导出定义链接。但是有了这个，我能够导出整套队列、交换等。我有一个 MQ 服务器，其中包含多个应用程序的 MQ 设置
java - 复制maven项目的正确方法(备份)
我在 Eclipse IDE 中做了一个 Maven 项目，但在某些时候，我决定以其他名称复制并粘贴工作区位置中的文件夹，以避免在迄今为止工作正常的原始项目中进行一些错误配置，但是，我在执行中遇到了问
jQuery - 备份/缓存元素的事件？
有没有办法备份在任何给定元素上设置的所有事件？背景故事:我有一些代码，当用户将鼠标悬停在某个图标上时(想想悬停帮助文本)，会显示绝对定位的“弹出窗口”。如果用户将鼠标悬停在弹出窗口上，它会停留在周围
MySQL 备份/恢复问题
我需要将 MySQL 数据库移动到新位置。根据workbench，数据库大小只有200MB，但有些表有数百万行，报告索引和数GB的数据长度。结果，EXPORT 的大小为 15GB，导出 DB 并将其复
MySQL复制表到另一个数据库(不在同一网络)-备份？
我有一个工作数据库 - 我想复制它的所有数据(甚至只是其中的 1 个表)并在磁盘上创建备份，并在另一个位置(不是同一台计算机)上创建一个“备份”数据库。另一台计算机未连接到互联网我该怎么做？最佳答
mysql - 备份/复制mysql数据库
我有一个实时数据库，我想要做的是制作一份副本。我可以通过 SSH 和 phpMyAdmin 访问 MySQl。是否有一个命令可以在单个命令/操作中复制/备份数据库，而无需使用导出/导入？谢谢最佳答
database - 备份 PostgreSQL
我是 PostgreSQL 的新手，我正在寻找备份数据库的方法。我知道有 3 种方法 pg_dump，快照和复制以及使用 WAL。您建议使用哪一个来完整备份数据库？如果可能，请提供代码片段。最佳答案
mysql - 备份/恢复mysql数据库中的数据
如何快速备份/恢复mysql数据库中的数据？最佳答案 mysqldump命令行备份最快， (使用mysql命令行恢复，mysql -u #username# -p #database# < #dum
MySql 备份/变更监控
从管理的角度来看，我是 MySQL 的新手。在过去的几个小时里，我一直在谷歌上搜索，但没有成功，我想知道是否有人可以为我指明正确的方向，让我知道要用谷歌搜索什么或提出建议。基本上，我正在寻找有关如
使用创建架构的 Mysql 备份
我需要备份创建模式附带的数据库(转储)。使用 putty(通过 SSH)完成这项工作的命令行是什么？我研究并思考了这个命令，但它只执行表备份和数据。 mysqldump -h HOST -u LOGI
Linux 备份 Bash
我正在尝试创建一个将整个/dev/sda1 备份到/mnt/Backup 的 bash 脚本 /dev/sda1 457G 3.5G 431G 1% / /dev/sdb1

首页

博学

6Ren·AI

商城

html - 如何在 Ruby 脚本中备份整个网页(包括图像等)？