gpt4 book ai didi

javascript - 将网页和外链资源保存为独立的静态资源

转载 作者:太空狗 更新时间:2023-10-29 15:36:33 26 4
gpt4 key购买 nike

我们有一个需求就是尽可能准确地缓存网页,这样我们就可以回过头来查看之前任意时间点的页面版本。我们希望能够按实际情况查看页面 - 使用正确的 css、javascript、图像等。

是否有任何操作系统库(任何语言)可以获取页面、下载所有外部链接的 Assets 并重写链接以使其指向本地缓存的 Assets ?

或者这是我们自己推出的案例?

谢谢

编辑:我意识到,如果不呈现动态生成的链接等,除非我们进行 DOM 呈现,否则这不会 100% 可行。然而,暂时我们可能没有这个。

最佳答案

我建议 HTTrack: http://www.httrack.com/

由于该软件是免费的、开源的,并且同时支持可视化界面和命令行,相信您可以顺利地集成或定制您的需求。

查看说明:

“HTTrack 允许您将万维网站点从 Internet 下载到本地目录,递归构建所有目录,从服务器获取 HTML、图像和其他文件到您的计算机。

它安排了原始站点的相关链接结构。只需在浏览器中打开“镜像”网站的一个页面,您就可以从一个链接到另一个链接浏览该网站,就像在线查看一样。

它还可以更新现有的镜像站点,并恢复中断的下载。”

您可以在什么操作系统上运行它:

WebHTTrack 适用于 Linux/Unix/BSD:Debian、Ubuntu、Gentoo、RPM 包(Mandriva 和 RedHat)、OSX (MacPorts)、Fedora 和 FreeBSD i386 包。

WinHTTrack 适用于 Windows 2000/XP/Vista/Seven

--

更新:元素处于活跃状态,最新版本提交于04/01/2017

关于javascript - 将网页和外链资源保存为独立的静态资源,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3997179/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com